【初心者向け】PandasでCSVを扱う7つの基本操作まとめ

【初心者向け】PandasでCSVを扱う7つの基本操作まとめ データ分析入門

はじめに:集計の手間、Pythonなら一瞬で終わります

日々のマーケティング業務やレポート作業で、
「表データの集計や抽出がめんどくさい…」と思ったことはありませんか?

実は、PythonのPandasを使えば、
「毎月やってる集計」を一瞬で自動化できて、
しかも再利用・再計算もラクにできるようになります。

この記事では、広告代理店のメディアプランナーとして実際に使ってきた経験をもとに、
「Pandasでよく使う7つの基本操作」を、CSVファイルからの読み込みを起点にご紹介します。

実務での活用例:媒体別リーチ率の集計に使った話

あるキャンペーンのメディア予算配分を設計する際、
僕はこんなCSVデータを使っていました👇

📄 CSVデータの構造(例)

編集長
編集長

【A列】:広告予算
【B~D列】:各媒体のリーチ率を示したデータです!

このデータを読み込み、Pandasで一括集計&抽出することで、
「予算に応じてどの媒体のリーチ率が効率的か」をすばやく可視化し、
媒体別の割り振りシミュレーションに活用しました。

Excelでもできないことはないですが、
Pandasなら元データが変わっても再実行で一発更新。
これが、業務効率化の鍵でした。

まずはCSVを読み込もう(read_csv)

では、実際にcsvファイルをPythonに読み込ませていきます。
以下のコードをPythonに打ち込んでください。

import pandas as pd

# CSVの読み込み
df = pd.read_csv("media_reach.csv")
print(df.head())

※「csvファイルが読み込めない」という方は以下の記事を参考にしてみてください。
【初心者向け】PandasでCSVが読み込めないときの原因と対処法

📌 ここがポイント:
Pandasのread_csv()を使えば、表形式のデータをそのままPythonで扱えます。
Google Colab上でもアップロード→読み込みでOKです。

ちなみに、print(df.head())を打つと
こんなグラフが出力されました。

よく使うPandasの基本操作7選

ここからは、僕が実務でよく使う7つの操作を具体例とともに紹介します!

1. 特定の列だけを取り出す

打つべきコードはたったのこれだけ。

df[["cost","YouTube"]]

→ 任意の媒体データだけを取り出して、絞り込んだ分析や可視化に使えます。

実行ボタンを押すと以下のようなグラフが出力されました。
成功です。

2. 行を条件で抽出する(フィルター)

こちらもコードはたったこれだけ。

df[df["TV"] > 0.2]

→ 「TVのリーチ率が20%以上のケースだけを見たい」など、条件を満たす行だけを抽出できます。

実行ボタンを押すと以下のようなグラフが出力されました。
成功です。

3. 列の平均・合計を求める

df[["TV", "YouTube", "TVer"]].mean()
df[["TV", "YouTube", "TVer"]].sum()

→ 媒体別の平均リーチ率や、合計リーチ率の目安を算出できます。

ちなみに、合計(sum)の場合は
以下のようなグラフが出力されました。
成功です。

4. 行や列の名前を変更する

df.rename(columns={'cost': 'Budget'})

→ プレゼンや資料化の際にラベルを見やすくするために使います。

編集長
編集長

csvファイルのラベルが日本語表記だとPythonがうまく回らないことも。
そんな時、このrename関数で一発で英語表記に直すことができるよ!

5. データの並び替え

df.sort_values("TVer", ascending=False)

→ 「リーチ率が高い順」「予算が少ない順」など、意思決定を支える見せ方ができます。

ちなみに、TVerのリーチ率が高い順に並び替えたいの場合は以下のようなグラフが出力されました。
成功です。

6. 新しい指標(列)を追加する

df["YouTube-efficiency"] = df["YouTube"] / df["cost"]
print(df[["cost", "YouTube", "YouTube-efficiency"]])

→ このコードはリーチ率を広告費で割ることで「1円あたりのリーチ効率」を算出したものですが、
複数媒体の合計リーチなど、独自のKPI計算もワンライナーで可能です。

実行ボタンを押すと以下のようなグラフが出力されました。
成功です。

7. データをCSVで書き出す(結果保存)

df.to_csv("output.csv", index=False)

→ 結果をExcelに戻したり、クライアント共有用データとして活用できます。

まとめ:単純作業を一瞬で終わらせる武器、それがPandas

実務では、CSVを元にした「集計・抽出・再集計」は日常茶飯事です。
Pandasを使えば、それらの作業を数行で自動化→再利用→分析に発展させることができます。

しかも、
「一度コードを書いておけば、あとは元データを変えるだけ」で再計算できる。
これが、手間の削減にも説得力の強化にも直結します。

🎯非エンジニアのあなたにとってのメリット

面倒な集計や単純作業を“定型化”して、考えるべきところに時間を割けるようになる
Pandasはまさに、そんな武器です。

コメント

タイトルとURLをコピーしました