Datawhale AI 夏/冬令营😀
AI-MapBook 是一个利用LLM技术为故事讲述提供地图支持的项目。它通过大型语言模型(LLM)从书籍中提取地理信息和属性信息,结合地理编码得到地理坐标数据,并在交互式地图上进行可视化展示,为读者提供沉浸式的故事探索体验。该项目适用于故事创作者、教育工作者和地图爱好者,通过结合人工智能和地理空间技术,增强叙事效果。
- 考古分析
- 地理历史学习
- 军事情报检索
- 社交网络分析
- 后端: python原生
- 前端: Streamlit
- 数据提取🏆: 使用LLM从故事书籍中提取地理信息和属性信息。
- 数据处理🏆: 将提取的事件信息进行处理得到地理坐标,以便在前端进行展示。
- 地图可视化🏆: 利用Leaflet在前端展示交互式地图,并在地图上标记提取的坐标点。
- 用户交互🏆: 提供用户界面,允许用户浏览和探索故事中的地理信息。
- RAG问答🎯:通过对用户上传的PDF或TXT文件进行向量化检索存储,并使用RAG模型进行问答,实现故事中地理信息的查询和展示。
- 用户意图识别🎯: 通过一个意图识别Agent来提取用户意图,进而创建交互模板,构建地图,支持内容导出文件(开发中)。
AI-MapBook/
├── app.py
├── requirements.txt
├── install.py
├── models
├── storage
├── data
├──utils
│ └── __init__.py
│ └── geocode_utils.py
│ └── model_back.py
│ └── text_processing.py
│ └── map.py
│ └── rag.py
|.env_example
├── LICENSE
├── README.md
-
进入项目目录:
cd AI-MapBook
-
配置环境及安装依赖:
conda create --name map-book python=3.10.13 conda activate map-book pip install -r requirements.txt python install.py
3.在配置文件中配置自己的deepseekAPIkey:
APP_ID=a947a47f
QWEN_API_KEY=cf9fe03690faee5d185fcd753052d652
API_SECRET=ZDE5ODRkNThmNTgwMWIzYjZlMDBlMGU1
SERVICE_ID=xsqwen2d53b
PATCH_ID=1869819130578763776
BASE_URL= "https://api.deepseek.com"
DEEPSEEK_API_KEY=your_deepseek_api_key
这里使用的qwen2.5-3B模型是作者讯飞微调的模型,额度过期后就不能使用了,可以配置自己微调的模型;如果没有推荐直接网页端输入自己的deepseek api使用;
- 启动后端服务:
streamlit run app.py
我们欢迎任何形式的贡献,包括但不限于代码提交、问题反馈、功能建议等。
本项目采用 GNU Affero General Public License (AGPL)。