使用 PyMySQL 连接到 TiDB

TiDB 是一个兼容 MySQL 的数据库。PyMySQL 为当前流行的开源 Python Driver 之一。

本文档将展示如何使用 TiDB 和 PyMySQL 来完成以下任务:

  • 配置你的环境。
  • 使用 PyMySQL 连接到 TiDB 集群。
  • 构建并运行你的应用程序。你也可以参考示例代码片段,完成基本的 CRUD 操作。

前置需求

运行代码并连接到 TiDB

本小节演示如何运行示例应用程序的代码,并连接到 TiDB。

第 1 步:克隆示例代码仓库到本地

运行以下命令,将示例代码仓库克隆到本地:

git clone https://github.com/tidb-samples/tidb-python-pymysql-quickstart.git cd tidb-python-pymysql-quickstart

第 2 步:安装依赖

运行以下命令,安装示例代码所需要的依赖(包括 pymysql):

pip install -r requirements.txt

第 3 步:配置连接信息

根据不同的 TiDB 部署方式,使用不同的方法连接到 TiDB 集群。

  • TiDB Serverless
  • TiDB Dedicated
  • 本地部署 TiDB
  1. 在 TiDB Cloud 的 Clusters 页面中,选择你的 TiDB Serverless 集群,进入集群的 Overview 页面。

  2. 点击右上角的 Connect 按钮,将会弹出连接对话框。

  3. 确认对话框中的配置和你的运行环境一致。

    • Endpoint TypePublic
    • Connect With 选择 General
    • Operating System 为你的运行环境。
  4. 如果你还没有设置密码,点击 Create password 生成一个随机密码。

  5. 运行以下命令,将 .env.example 复制并重命名为 .env

    cp .env.example .env
  6. 复制并粘贴对应连接字符串至 .env 中。示例结果如下:

    TIDB_HOST='{host}' # e.g. gateway01.ap-northeast-1.prod.aws.tidbcloud.com TIDB_PORT='4000' TIDB_USER='{user}' # e.g. xxxxxx.root TIDB_PASSWORD='{password}' TIDB_DB_NAME='test' CA_PATH='{ssl_ca}' # e.g. /etc/ssl/certs/ca-certificates.crt (Debian / Ubuntu / Arch)

    注意替换 {} 中的占位符为连接对话框中获得的值。

  7. 保存 .env 文件。

  1. 在 TiDB Cloud 的 Clusters 页面中,选择你的 TiDB Dedicated 集群,进入集群的 Overview 页面。

  2. 点击右上角的 Connect 按钮,将会出现连接对话框。

  3. 在对话框中点击 Allow Access from Anywhere,然后点击 Download TiDB cluster CA 下载 TiDB Cloud 提供的 CA 证书。

    更多配置细节,可参考 TiDB Dedicated 标准连接教程(英文)

  4. 运行以下命令,将 .env.example 复制并重命名为 .env

    cp .env.example .env
  5. 复制并粘贴对应的连接字符串至 .env 中。示例结果如下:

    TIDB_HOST='{host}' # e.g. tidb.xxxx.clusters.tidb-cloud.com TIDB_PORT='4000' TIDB_USER='{user}' # e.g. root TIDB_PASSWORD='{password}' TIDB_DB_NAME='test' CA_PATH='{your-downloaded-ca-path}'

    注意替换 {} 中的占位符为连接对话框中获得的值,并配置前面步骤中下载好的证书路径。

  6. 保存 .env 文件。

  1. 运行以下命令,将 .env.example 复制并重命名为 .env

    cp .env.example .env
  2. 复制并粘贴对应 TiDB 的连接字符串至 .env 中。示例结果如下:

    TIDB_HOST='{host}' TIDB_PORT='4000' TIDB_USER='root' TIDB_PASSWORD='{password}' TIDB_DB_NAME='test'

    注意替换 {} 中的占位符为你的 TiDB 对应的值,并删除 CA_PATH 这行。如果你在本机运行 TiDB,默认 Host 地址为 127.0.0.1,密码为空。

  3. 保存 .env 文件。

第 4 步:运行代码并查看结果

  1. 运行下述命令,执行示例代码:

    python pymysql_example.py
  2. 查看 Expected-Output.txt,并与你的程序输出进行比较。结果近似即为连接成功。

示例代码片段

你可参考以下关键代码片段,完成自己的应用开发。

完整代码及其运行方式,见代码仓库 tidb-samples/tidb-python-pymysql-quickstart

连接到 TiDB

from pymysql import Connection from pymysql.cursors import DictCursor def get_connection(autocommit: bool = True) -> Connection: config = Config() db_conf = { "host": ${tidb_host}, "port": ${tidb_port}, "user": ${tidb_user}, "password": ${tidb_password}, "database": ${tidb_db_name}, "autocommit": autocommit, "cursorclass": DictCursor, } if ${ca_path}: db_conf["ssl_verify_cert"] = True db_conf["ssl_verify_identity"] = True db_conf["ssl_ca"] = ${ca_path} return pymysql.connect(**db_conf)

在使用该函数时,你需要将 ${tidb_host}${tidb_port}${tidb_user}${tidb_password}${tidb_db_name} 以及 ${ca_path} 替换为你的 TiDB 集群的实际值。

插入数据

with get_connection(autocommit=True) as conn: with conn.cursor() as cur: player = ("1", 1, 1) cursor.execute("INSERT INTO players (id, coins, goods) VALUES (%s, %s, %s)", player)

更多信息参考插入数据

查询数据

with get_connection(autocommit=True) as conn: with conn.cursor() as cur: cur.execute("SELECT count(*) FROM players") print(cursor.fetchone()["count(*)"])

更多信息参考查询数据

更新数据

with get_connection(autocommit=True) as conn: with conn.cursor() as cur: player_id, amount, price="1", 10, 500 cursor.execute( "UPDATE players SET goods = goods + %s, coins = coins + %s WHERE id = %s", (-amount, price, player_id), )

更多信息参考更新数据

删除数据

with get_connection(autocommit=True) as conn: with conn.cursor() as cur: player_id = "1" cursor.execute("DELETE FROM players WHERE id = %s", (player_id,))

更多信息参考删除数据

注意事项

使用驱动程序还是 ORM 框架?

Python 驱动程序提供对数据库的底层访问,但要求开发者:

  • 手动建立和释放数据库连接
  • 手动管理数据库事务
  • 手动将数据行(在 pymysql 中表示为元组 (tuple) 或者字典 (dict))映射为数据对象

建议仅在需要编写复杂的 SQL 语句时使用驱动程序。其他情况下,建议使用 ORM 框架进行开发,例如 SQLAlchemyPeewee 和 Django。ORM 可以帮助你:

  • 减少管理连接和事务的模板代码
  • 使用数据对象代替大量 SQL 语句来操作数据

下一步

需要帮助?

如果在开发的过程中遇到问题,可以在 AskTUG 上进行提问,寻求帮助。