
DeepSeek 导航网:Intelligent-Chat-Robot 是一个基于大语言模型的多模态智能聊天助手,专为传智杯人工智能大模型创新应用挑战赛开发。本项目旨在探索大语言模型在实际应用场景中的潜力,通过整合语音识别、情感分析和图像处理等技术,打造一个功能丰富、交互自然的智能助手系统。
项目立足于本地化部署和隐私保护,采用 Ollama 框架调用本地大语言模型,同时结合科大讯飞的语音识别技术,实现了一个既智能又保护用户隐私的聊天系统。在传智杯比赛中,该项目凭借其创新性、实用性和技术实现获得了国家一等奖的荣誉。
核心功能
- 智能对话:基于本地部署的大语言模型(Qwen2、DeepSeek等)提供智能对话能力
- 多模态交互:支持文本、语音和图像多种输入方式
- 情感识别:能够分析用户情感并给予相应回应
- 语音交互:集成科大讯飞和 Google 语音识别,支持语音输入和语音播报
- 图像分析:支持上传图片并进行智能分析
- 自动模型选择:根据用户输入内容智能选择最合适的 AI 模型
- 多语言支持:支持中文、英文等多种语言的交互
安装与使用
环境要求
- Python 3.8+
- Ollama 服务(用于本地部署大语言模型)
- 科大讯飞开发者账号(用于语音识别)
安装步骤
- 克隆项目到本地
git clone https://github.com/your-username/zhichat-bot.git
cd zhichat-bot
- 安装依赖包
pip install -r requirements.txt
- 安装并启动 Ollama 服务
# 安装 Ollama(根据操作系统选择合适的安装方法)
# 启动 Ollama 服务
ollama serve
拉取所需模型 ollama pull qwen2 ollama pull deepseek-r1
- 配置科大讯飞 API 编辑 xunfei_config.py 文件,填入您的科大讯飞 API 密钥: APPID = '您的 APPID' API_KEY = '您的 API_KEY' API_SECRET = '您的 API_SECRET'
运行应用
streamlit run app.py
应用将在浏览器中自动打开,默认地址为: http://localhost:8501
- 模型选择 :可以在侧边栏选择自动或手动模式来控制使用的 AI 模型
- 语音交互 :点击"语音输入"按钮开始语音识别
- 图片分析 :通过上传图片功能可以让 AI 分析图像内容
- 参数调整 :在侧边栏可以调整模型的温度和采样阈值等参数
- 多语言支持 :可以在侧边栏切换界面语言
下载地址
- Github:访问
推荐LLMWINmacOSMCP