【超高速Pandas入門】列の抽出

列の抽出について

PandasのDataFrame型における列の抽出方法を記載する。

Udemy >> 現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル

この記事を読んでわかること

  • Dataframe型における列の抽出方法

まとめ

# csvファイルとして(ヘッダーあり)
DataFrame型.to_csv("ファイルパス", index=False)

# csvファイルとして(ヘッダーなし)
DataFrame型.to_csv("ファイルパス", index=False, header=False)

# テキストファイル(カンマ以外の区切り文字)として(ヘッダーあり)
DataFrame型.to_csv("ファイルパス", sep="区切り文字", index=False)

# テキストファイル(カンマ以外の区切り文字)として(ヘッダーなし)
DataFrame型.to_csv("ファイルパス", sep="区切り文字", index=False, header=False)

データ書き込み(保存)

CSVファイルとして

to_csvメソッドを使えば、名前の通りcsvとして書き出される。行のindexを付けたくない場合はindexオプションをFalseにする必要がある。個人的には行Indexを書き出すケースは少ないと思うので、ここでは行Indexは書き出さない。また文字コードはデフォルトでutf-8である。(encodingオプションで変更可能)

# 書き方
## ヘッダーをつける場合
DataFrame型.to_csv("ファイルパス", index=False)

## ヘッダーを付けない場合
DataFrame型.to_csv("ファイルパス", index=False, header=False)

# サンプル
import pandas as pd

list_data = [[1, 'apple', 100],[2, 'orange', 30],[3, 'lemon', 50]] 
df_list = pd.DataFrame(list_data, columns=["id","product","price"])
df_list.to_csv("data.csv", index=False)

## 以下のようなデータが保存される。(data.csv)
# id,product,price
# 1,apple,100
# 2,orange,30
# 3,lemon,50

Udemy >> Streamlit, Pandas, Pythonで学ぶ!データ分析の基礎とインタラクティブダッシュボード作成入門

テキストファイル(カンマ以外の区切り文字)として

上記と同じくto_csvを使い、sepオプションで区切り文字を指定すればよい。ちなみに\tはタブ区切り。

# 書き方
## ヘッダーをつける場合
DataFrame型.to_csv("ファイルパス", sep="区切り文字", index=False)

## ヘッダーを付けない場合
DataFrame型.to_csv("ファイルパス", sep="区切り文字", index=False, header=False)

# サンプル
import pandas as pd

list_data = [[1, 'apple', 100],[2, 'orange', 30],[3, 'lemon', 50]] 
df_list = pd.DataFrame(list_data, columns=["id","product","price"])
df_list.to_csv("data.csv", sep='\t', index=False)

## 以下のようなデータが保存される。(data.csv)
# id	product	price
# 1	apple	100
# 2	orange	30
# 3	lemon	50

Udemy >> 【世界で37万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜