伴随着大语言模型的火热,自然语言处理这个学科领域彻底被带起来了。很多同学想要学习自然语言处理,但又没有自然语言处理的专业背景,比如文科生。 有很多同学说,有了大模型,那么2022年以前的自然语言处理技术方法就已经都成为历史了,可以不用学了。真的是这样吗?我认为不对。因此,我想通过一个最极简的科普专栏,讲述自然语言处理这门学科从上个世纪到现在的变化。涵盖了基于规则、基于机器学习、基于深度学习、基于预训练模型和基于大语言模型五种范式的简单案例,但每一章都借助了当下最热的deepseek-r1模型帮助创建案例来理解。
本教程的编写参考了中国科学院大学人工智能学院《自然语言处理基础与大语言模型》课程PPT,感谢宗成庆老师和张家俊老师的授课,让我在课堂上学到了很多。本教程也可以看作是我的一个简单的学习心得。
这里写项目的各类介绍信息、背景、动机等内容
想要学习自然语言处理但对它完全没了解的同学,新手,非计算机科班背景的同学。
基础能力要求不高,我尽可能通俗一些地在写,会用deepseek就行。代码不要求能够全部跑通,但deepseek是要会用的。
注:这里写你的项目所面向的受众,本项目能给他们带来什么,对他们的基础能力要求有哪些
这里写你的项目目录,已完成的部分用添加上跳转链接
姓名 | 职责 | 简介 |
---|---|---|
若冰(马世拓) | 项目负责人 | 中国科学院大学网络空间安全学院,中国科学院信息工程研究所,研究方向为网络空间安全 |
有来一起共建的小伙伴可以联系我。我后续还想再整更hands-on的实操版(代码难度plus),同时还在整理一个巨型的前沿学术版(学术难度max)。
注:表头可自定义,但必须在名单中标明项目负责人
- 如果你发现了一些问题,可以提Issue进行反馈,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
- 如果你想参与贡献本项目,可以提Pull request,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
- 如果你对 Datawhale 很感兴趣并想要发起一个新的项目,请按照Datawhale开源项目指南进行操作即可~
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议