中文 | English
一个用于批量查询并收集全国高校地理信息的 Python 工具。基于腾讯地图 API,融合教育部数据和补充信息,导出结构化结果以便后续使用。
- 从 Excel 读取高校列表,并与详细 JSON 数据合并
- 调用腾讯地图 API 获取校区地理坐标(支持 QPS 限流与重试)
- 清洗与去重校区名称
- 输出 JSON 和 CSV 报告(包括错误与缺失数据报告)
- 全流程日志记录,便于追溯
- Python 3.8+
- 依赖见
requirements.txt
- 克隆本仓库:
git clone <repo-url> cd cn-university-geocoder
- 创建并激活虚拟环境(推荐):
- Windows:
python -m venv venv venv\Scripts\activate
- macOS/Linux:
python3 -m venv venv source venv/bin/activate
- Windows:
- 安装依赖:
pip install -r requirements.txt
- 在项目根目录准备
.env文件,填写腾讯地图 API 密钥:TENCENT_MAP_KEY="your_key" TENCENT_MAP_SK="your_secret_key"
运行主脚本:
python main.py- 日志将输出到带时间戳的日志文件(如
run_log_YYYYMMDD_HHMMSS.log)。 - 结果文件包括:
universities.json:带校区地理信息的高校universities_with_no_campuses.csv:未找到校区的高校rejected_pois.csv:被名称规则拒绝的 POIuniversities_without_details.csv:补充 JSON 缺失详细信息的高校
main.py— 主处理脚本requirements.txt— Python 依赖univ_moe.xls— 输入 Excel 文件univ_supp.json— 补充高校详细信息
- 本脚本专为中国高校数据与腾讯地图 API 设计。
- 请确保输入文件为最新,API 配额充足以获得最佳效果。