統計プログラムRの勉強日記

Rに関して勉強してきたことを紹介します

【R】データの先頭や末尾を取り出す方法|head関数 / tail関数

データの先頭や末尾を取り出す方法タイトル図

はじめに

今回はデータの先頭や末尾を取り出す関数であるhead関数やtail関数を紹介したいと思います。データが大量にある場合でもとりあえずデータの内容を簡単に確認したいことがあると思います。そんな時は今回紹介する関数を使ってデータの雰囲気をつかむことができます。

使い方

head関数やtail関数の使い方は簡単です。どちらの関数も使い方は同様で対象のデータと表示するデータ数を指定するだけです(データ数の指定はしなくても大丈夫です)。またこれらの関数はベクトルでもデータフレームでも基本的なデータタイプなら何でも適応することができます。

まずhead関数の使い方は以下の通りです。

head(対象データ, n = 表示するデータ数)
  • 対象データ:対象データ(ベクトルでもデータフレームでも可)
  • 表示するデータ数:指定しなければ表示するデータ数は6になります。

次にtail関数の使い方です。使い方はhead関数と同様で以下の通りです。

tail(対象データ, n = 表示するデータ数)
  • 対象データ:対象データ(ベクトルでもデータフレームでも可)
  • 表示するデータ数:指定しなければ表示するデータ数は6になります。

具体例

今回はdatasetsパッケージのirisデータを用いて先頭や末尾のデータを取り出すコードを紹介したいと思います。

データの先頭を取り出す

まずはhead関数を用いてデータの先頭を取り出すコードを紹介したいと思います。ここではirisデータから先頭6行のデータを抽出するコードを紹介します。(6行はデフォルトで設定されているデータ数です。何も指定しなければ6行表示されます。)

data = iris
head(data)

表示される結果は以下のようになります。

Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa

データの先頭を指定した行数取り出す

次にデータの先頭15行を取り出すコードを紹介したいと思います。何行取り出すかを指定する時は第2引数にデータ数を指定するだけで大丈夫です。 ここではirisデータから先頭15行のデータを抽出するコードを紹介します。

data = iris
head(data, n = 15)

表示される結果は以下のようになります。

Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
7 4.6 3.4 1.4 0.3 setosa
8 5 3.4 1.5 0.2 setosa
9 4.4 2.9 1.4 0.2 setosa
10 4.9 3.1 1.5 0.1 setosa
11 5.4 3.7 1.5 0.2 setosa
12 4.8 3.4 1.6 0.2 setosa
13 4.8 3 1.4 0.1 setosa
14 4.3 3 1.1 0.1 setosa
15 5.8 4 1.2 0.2 setosa

データの末尾を取り出す

最後にtail関数を用いてデータの末尾を取り出すコードを紹介したいと思います。この関数もデータ数を第2引数で指定しなければ末尾の6行が取り出されます。 今回はirisデータから末尾のデータを抽出するコードを紹介します。

data = iris
tail(data)

表示される結果は以下のようになります。

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
145 6.7 3.3 5.7 2.5 virginica
146 6.7 3 5.2 2.3 virginica
147 6.3 2.5 5 1.9 virginica
148 6.5 3 5.2 2 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3 5.1 1.8 virginica

まとめ

今回はデータの先頭や末尾を抽出する方法を紹介しました。とりあえずデータの中身を見てみたいときなどに便利な関数だと思います。もしよかったら使ってみて下さい。