扫码阅读
手机扫码阅读
大数据能力提升项目|学生成果展系列之二
323 2024-07-03
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
查看原文:大数据能力提升项目|学生成果展系列之二
文章来源:
数据派THU
扫码关注公众号
导读
清华大学实施的“大数据能力提升项目”旨在发挥学校多学科优势,创新培养模式,培养具有大数据思维的“π”型人才。该项目通过课程整合和混合式教学,显著提升了学生的大数据分析与应用能力。
项目成果
2023年,清华大学大数据能力提升项目取得了显著成果。学生们将所学的数据思维和技能应用到本专业的学习和科研中,成为交叉复合型的创新人才。
学生代表成果展示
环境学院 卓振江
卓振江在大数据项目中,开发了一个基于生态环境行业文本大数据的智能助手。该系统基于自然语言生成模型和Langchain搭建,能提供快速、全面的查询及整合服务。主要成果包括智能问答、用户信息管理和知识库配置等功能。
项目贡献
- 数据收集与处理:集成企业提供的文档和网站爬取的资讯,处理转换成文本格式。
- 模型选择与集成:选择清华开源模型ChatGLM2-6b,并利用相关库完成集成。
- 知识向量库建立:对文档向量化进行优化,实现单文档单向量库的存储方式,提升响应速度并方便管理。
- 实时流式对话:前端采用Django搭建聊天界面,后端优化调用逻辑,实现流式生成对话。
编辑:文婧
校对:杨学俊
想要了解更多内容?
查看原文:大数据能力提升项目|学生成果展系列之二
文章来源:
数据派THU
扫码关注公众号
没有了
上一篇
大数据能力提升项目|学生成果展系列之四
下一篇
数据派THU的其他文章
加入社区微信群
与行业大咖零距离交流学习
SAFe6.0与CMMI3.0映射
白皮书上线
白皮书上线