ExcelからCSVの変換

ExcelデータからCSVを出力するチュートリアル

このチュートリアルでは、ExcelファイルをReNom TDAのGUI用のcsvファイルに変換します。

必要なモジュール

xlrd==1.1.0

In [1]:
import pandas as pd

Excelファイルのロード

In [2]:
xls_file = "test.xlsx"
sheet_name = "Sheet1"
xls_data = pd.read_excel(xls_file, sheetname=sheet_name)
In [3]:
xls_data
Out[3]:
category1 category2 category3 number1 number2
0 テスト1 A 0 0.0 1
1 テスト2 A 0 0.2 2
2 テスト3 B 0 0.4 3
3 テスト4 B 1 0.6 4
4 テスト5 B 1 0.8 5

データの型を確認

データの変数の型を確認します。

ReNom TDAのGUIでは、データの型がint64またはfloat64の項目を使ってトポロジーのグラフを作ります。

object型のデータは検索用のデータとして使用します。

In [4]:
xls_data.dtypes
Out[4]:
category1     object
category2     object
category3      int64
number1      float64
number2        int64
dtype: object

データ型の変換

数値型のカテゴリデータが存在する場合は、数値型からオブジェクト型にデータの型を変更してください。

In [5]:
xls_data["category3"] = xls_data["category3"].astype(object)
In [6]:
xls_data.dtypes
Out[6]:
category1     object
category2     object
category3     object
number1      float64
number2        int64
dtype: object

カラムの選択

出力するカラムを選びます。

In [8]:
use_columns = ["category1", "category3", "number1", "number2"]
output_data = xls_data[use_columns]
In [9]:
output_data
Out[9]:
category1 category3 number1 number2
0 テスト1 0 0.0 1
1 テスト2 0 0.2 2
2 テスト3 0 0.4 3
3 テスト4 1 0.6 4
4 テスト5 1 0.8 5

csv出力

csvファイルに出力します。

In [10]:
output_data.to_csv("outpt.csv", index=False)