サンプル データベースのインポート

TiDB マニュアルで使用されている例では、Capital Bikeshare のシステムデータCapital Bikeshare データ ライセンス契約でリリースされています。

すべてのデータファイルをダウンロード

システム データは、1 年に.zip ファイルでのダウンロード用編成利用できます。すべてのファイルをダウンロードして解凍するには、約 3GB のディスク容量が必要です。 bash スクリプトを使用して 2010 年から 2017 年のすべてのファイルをダウンロードするには:

mkdir -p bikeshare-data && cd bikeshare-data curl -L --remote-name-all https://s3.amazonaws.com/capitalbikeshare-data/{2010..2017}-capitalbikeshare-tripdata.zip unzip \*-tripdata.zip

データを TiDB にロードする

システム データは、次のスキーマを使用して TiDB にインポートできます。

CREATE DATABASE bikeshare; USE bikeshare; CREATE TABLE trips ( trip_id bigint NOT NULL PRIMARY KEY AUTO_INCREMENT, duration integer not null, start_date datetime, end_date datetime, start_station_number integer, start_station varchar(255), end_station_number integer, end_station varchar(255), bike_number varchar(255), member_type varchar(255) );

ここでサンプルLOAD DATAコマンドを使用してファイルを個別にインポートするか、以下の bash ループを使用してすべてのファイルをインポートできます。

SET tidb_dml_batch_size = 20000; LOAD DATA LOCAL INFILE '2017Q1-capitalbikeshare-tripdata.csv' INTO TABLE trips FIELDS TERMINATED BY ',' ENCLOSED BY '"' LINES TERMINATED BY '\r\n' IGNORE 1 LINES (duration, start_date, end_date, start_station_number, start_station, end_station_number, end_station, bike_number, member_type);

すべてのファイルをインポート

ノート:

MySQL クライアントを起動するときは、 --local-infile=1オプションを使用します。

すべての*.csvファイルを bash ループで TiDB にインポートするには:

for FILE in *.csv; do echo "== $FILE ==" mysql bikeshare --local-infile=1 -e "SET tidb_dml_batch_size = 20000; LOAD DATA LOCAL INFILE '${FILE}' INTO TABLE trips FIELDS TERMINATED BY ',' ENCLOSED BY '\"' LINES TERMINATED BY '\r\n' IGNORE 1 LINES (duration, start_date, end_date, start_station_number, start_station, end_station_number, end_station, bike_number, member_type);" done;