扫码阅读
手机扫码阅读

大数据能力提升项目|学生成果展系列之二

278 2024-07-03

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:大数据能力提升项目|学生成果展系列之二
文章来源:
数据派THU
扫码关注公众号

导读

清华大学实施的“大数据能力提升项目”旨在发挥学校多学科优势,创新培养模式,培养具有大数据思维的“π”型人才。该项目通过课程整合和混合式教学,显著提升了学生的大数据分析与应用能力。

项目成果

2023年,清华大学大数据能力提升项目取得了显著成果。学生们将所学的数据思维和技能应用到本专业的学习和科研中,成为交叉复合型的创新人才。

学生代表成果展示

环境学院 卓振江

卓振江在大数据项目中,开发了一个基于生态环境行业文本大数据的智能助手。该系统基于自然语言生成模型和Langchain搭建,能提供快速、全面的查询及整合服务。主要成果包括智能问答、用户信息管理和知识库配置等功能。

项目贡献

  • 数据收集与处理:集成企业提供的文档和网站爬取的资讯,处理转换成文本格式。
  • 模型选择与集成:选择清华开源模型ChatGLM2-6b,并利用相关库完成集成。
  • 知识向量库建立:对文档向量化进行优化,实现单文档单向量库的存储方式,提升响应速度并方便管理。
  • 实时流式对话:前端采用Django搭建聊天界面,后端优化调用逻辑,实现流式生成对话。

编辑:文婧
校对:杨学俊

想要了解更多内容?

查看原文:大数据能力提升项目|学生成果展系列之二
文章来源:
数据派THU
扫码关注公众号