关于王道Python课程
Python方向往期就业数据
王道Python课程介绍
Python语言特点✦
适用人群✦
职业发展与规划✦
报名要求✦
开班时间✦
学习时间规划✦
学习时长:总计15周。
学习时间:每天9:00-12:00、 14:00-18:00上课,上午2节课,下午2节课,每节课1小时,19:30-22:30写作业。一周5天半,学习强度还是比较大的。
授课方式及地点✦
授课老师✦
关于就业✦
关于实战项目✦
项目一:电商平台
项目介绍
项目二:电商客户价值分析
项目介绍
项目三:智能聊天机器人
项目介绍
该项目基于注意力机制、seq2seq模型,实现检索式、中文对话的智能聊天机器人。
项目可以不使用王道提供的语料集,可以使用学校导师提供的语料集,因此完全不用担心毕设类似的问题。
谷歌TensorFlow官方的官方有西班牙语翻译为英语(使用seq2seq模型),还有葡萄牙语翻译为英语(使用Transformer,目前ChatGPT使用的技术正是Transformer)的高级项目,我们都会讲解。
技术亮点
收集中文电影对白、小黄鸡语料等中文开源语料集,进行数据预处理,包括在每个句子开始结尾处添加标记taken、删除特殊字符、填充语句、建立文本映射自定义神经网络层,在编码器Encoder加入Embedding层,将文本离散变量转化为连续变量,在解码器Decoder中使用注意力机制Attention。
自定义优化器和损失函数,加入dropout来缓解模型的过拟合,设置检查点来保存模型,使用阿里云GPU服务器来训练模型(掌握NVIDIA GPU的使用)。
基于Django框架编写web端,部署上线人机交互、支持中文的智能聊天机器人。
项目四:推荐系统
项目介绍
王道头条推荐系统建立在头条APP海量用户与海量文章之上,使用lambda大数据实时和离线计算整体架构,利用王道头条用户在APP上的点击行为、浏览行为、收藏行为等建立用户与文章之间的画像关系,通过机器学习推荐算法进行智能推荐。
增加热门文章和新文章的推荐占比,达到千人千面的用户推荐效果。主要推荐场景首页频道推荐文章相似结果。
技术亮点
基础数据层:业务数据主要包含用户数据和文章数据。
用户数据即王道头条注册用户的基础数据,文章数据在自媒体平台上传的文章的基本信息。
用户行为日志数据来源于前端埋点技术,包括业务数据和用户行为日志数据。业务批量存储在HDFS上以用作离线分析。日志数据实时流向Kafka以用作实时计算。
数据处理层:
基础计算:基于离线和实时数据,对各类基础数据计算成用户画像、文章画像。召回与排序召回环节使用各种算法逻辑从海量的文章中筛选出用户感兴趣的文章候选集合,集合大小:上千级别。排序即对候选集合中的文章进行用户相对的模型结果排序,生成一个排序列表。排序点击率预估模型特征处理、模型评价推荐业务层:通过对外提供rpc接口来实现推荐业务的接入Feed流推荐:今日推荐场景,用户可以在这些页面中不断下拉刷新。
项目五:ChatGPT大模型实战
项目介绍
ChatGPT是由OpenAI开发的一种基于Transformer结构的大型语言模型。它是目前最先进的对话生成模型之一,可以根据给定的输入文本生成连贯、自然的回复。
ChatGPT使用了非常大的训练数据集和模型参数量,并采用了预训练和微调等技术,从而实现了优异的性能。在许多NLP任务中,如问答、摘要、翻译和情感分析等方面,ChatGPT都表现出了很高的效果,已成为自然语言处理领域的重要突破之一。
LLaMa模型是Meta开源的大模型,模型参数从7B到65B不等,LLaMa-7B在大多数基准测试上超过了GPT3-173B,而LLaMa-65B和Chinchilla-70B、PaLM-540B相比也极具竞争力。相比于GPT4来说,LLaMa可能效果上还有差距,但相比Closed AI,至少LLaMa论文和模型都开源出来了,目前hugging face已集成了LLaMa的代码实现和开源模型。
学术界和工业界都可以在此基础上进行学习和研究(目前国内各大厂,及Top 985名校都在研究LLaMa模型)。
国内目前开源最流行的是ChatGLM,ChatGLM是由清华推出的开源大语言模型。
技术亮点
往期学员好评✦
Q&A✦
写在最后✦