はじめに
今回はデータの先頭や末尾を取り出す関数であるhead
関数やtail
関数を紹介したいと思います。データが大量にある場合でもとりあえずデータの内容を簡単に確認したいことがあると思います。そんな時は今回紹介する関数を使ってデータの雰囲気をつかむことができます。
使い方
head
関数やtail
関数の使い方は簡単です。どちらの関数も使い方は同様で対象のデータと表示するデータ数を指定するだけです(データ数の指定はしなくても大丈夫です)。またこれらの関数はベクトルでもデータフレームでも基本的なデータタイプなら何でも適応することができます。
まずhead
関数の使い方は以下の通りです。
head(対象データ, n = 表示するデータ数)
- 対象データ:対象データ(ベクトルでもデータフレームでも可)
- 表示するデータ数:指定しなければ表示するデータ数は6になります。
次にtail
関数の使い方です。使い方はhead
関数と同様で以下の通りです。
tail(対象データ, n = 表示するデータ数)
- 対象データ:対象データ(ベクトルでもデータフレームでも可)
- 表示するデータ数:指定しなければ表示するデータ数は6になります。
具体例
今回はdatasets
パッケージのiris
データを用いて先頭や末尾のデータを取り出すコードを紹介したいと思います。
データの先頭を取り出す
まずはhead
関数を用いてデータの先頭を取り出すコードを紹介したいと思います。ここではiris
データから先頭6行のデータを抽出するコードを紹介します。(6行はデフォルトで設定されているデータ数です。何も指定しなければ6行表示されます。)
data = iris head(data)
表示される結果は以下のようになります。
Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | |
---|---|---|---|---|---|
1 | 5.1 | 3.5 | 1.4 | 0.2 | setosa |
2 | 4.9 | 3 | 1.4 | 0.2 | setosa |
3 | 4.7 | 3.2 | 1.3 | 0.2 | setosa |
4 | 4.6 | 3.1 | 1.5 | 0.2 | setosa |
5 | 5 | 3.6 | 1.4 | 0.2 | setosa |
6 | 5.4 | 3.9 | 1.7 | 0.4 | setosa |
データの先頭を指定した行数取り出す
次にデータの先頭15行を取り出すコードを紹介したいと思います。何行取り出すかを指定する時は第2引数にデータ数を指定するだけで大丈夫です。
ここではiris
データから先頭15行のデータを抽出するコードを紹介します。
data = iris head(data, n = 15)
表示される結果は以下のようになります。
Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | |
---|---|---|---|---|---|
1 | 5.1 | 3.5 | 1.4 | 0.2 | setosa |
2 | 4.9 | 3 | 1.4 | 0.2 | setosa |
3 | 4.7 | 3.2 | 1.3 | 0.2 | setosa |
4 | 4.6 | 3.1 | 1.5 | 0.2 | setosa |
5 | 5 | 3.6 | 1.4 | 0.2 | setosa |
6 | 5.4 | 3.9 | 1.7 | 0.4 | setosa |
7 | 4.6 | 3.4 | 1.4 | 0.3 | setosa |
8 | 5 | 3.4 | 1.5 | 0.2 | setosa |
9 | 4.4 | 2.9 | 1.4 | 0.2 | setosa |
10 | 4.9 | 3.1 | 1.5 | 0.1 | setosa |
11 | 5.4 | 3.7 | 1.5 | 0.2 | setosa |
12 | 4.8 | 3.4 | 1.6 | 0.2 | setosa |
13 | 4.8 | 3 | 1.4 | 0.1 | setosa |
14 | 4.3 | 3 | 1.1 | 0.1 | setosa |
15 | 5.8 | 4 | 1.2 | 0.2 | setosa |
データの末尾を取り出す
最後にtail
関数を用いてデータの末尾を取り出すコードを紹介したいと思います。この関数もデータ数を第2引数で指定しなければ末尾の6行が取り出されます。
今回はiris
データから末尾のデータを抽出するコードを紹介します。
data = iris tail(data)
表示される結果は以下のようになります。
Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | |
---|---|---|---|---|---|
145 | 6.7 | 3.3 | 5.7 | 2.5 | virginica |
146 | 6.7 | 3 | 5.2 | 2.3 | virginica |
147 | 6.3 | 2.5 | 5 | 1.9 | virginica |
148 | 6.5 | 3 | 5.2 | 2 | virginica |
149 | 6.2 | 3.4 | 5.4 | 2.3 | virginica |
150 | 5.9 | 3 | 5.1 | 1.8 | virginica |
まとめ
今回はデータの先頭や末尾を抽出する方法を紹介しました。とりあえずデータの中身を見てみたいときなどに便利な関数だと思います。もしよかったら使ってみて下さい。