サンプル データベースのインポート
TiDB マニュアルで使用されている例では、Capital Bikeshare のシステムデータがCapital Bikeshare データ ライセンス契約でリリースされています。
すべてのデータファイルをダウンロード
システム データは、1 年に.zip ファイルでのダウンロード用編成利用できます。すべてのファイルをダウンロードして解凍するには、約 3GB のディスク容量が必要です。 bash スクリプトを使用して 2010 年から 2017 年のすべてのファイルをダウンロードするには:
mkdir -p bikeshare-data && cd bikeshare-data
curl -L --remote-name-all https://s3.amazonaws.com/capitalbikeshare-data/{2010..2017}-capitalbikeshare-tripdata.zip
unzip \*-tripdata.zip
データを TiDB にロードする
システム データは、次のスキーマを使用して TiDB にインポートできます。
CREATE DATABASE bikeshare;
USE bikeshare;
CREATE TABLE trips (
trip_id bigint NOT NULL PRIMARY KEY AUTO_INCREMENT,
duration integer not null,
start_date datetime,
end_date datetime,
start_station_number integer,
start_station varchar(255),
end_station_number integer,
end_station varchar(255),
bike_number varchar(255),
member_type varchar(255)
);
ここでサンプルLOAD DATA
コマンドを使用してファイルを個別にインポートするか、以下の bash ループを使用してすべてのファイルをインポートできます。
SET tidb_dml_batch_size = 20000;
LOAD DATA LOCAL INFILE '2017Q1-capitalbikeshare-tripdata.csv' INTO TABLE trips
FIELDS TERMINATED BY ',' ENCLOSED BY '"'
LINES TERMINATED BY '\r\n'
IGNORE 1 LINES
(duration, start_date, end_date, start_station_number, start_station,
end_station_number, end_station, bike_number, member_type);
すべてのファイルをインポート
ノート:
MySQL クライアントを起動するときは、
--local-infile=1
オプションを使用します。
すべての*.csv
ファイルを bash ループで TiDB にインポートするには:
for FILE in *.csv; do
echo "== $FILE =="
mysql bikeshare --local-infile=1 -e "SET tidb_dml_batch_size = 20000; LOAD DATA LOCAL INFILE '${FILE}' INTO TABLE trips FIELDS TERMINATED BY ',' ENCLOSED BY '\"' LINES TERMINATED BY '\r\n' IGNORE 1 LINES (duration, start_date, end_date, start_station_number, start_station, end_station_number, end_station, bike_number, member_type);"
done;