您现在的位置:首页 > 企业内训 > ChatGPT核心算法应用与实践培训

ChatGPT核心算法应用与实践培训

2023-2-17 10:18:47 | 来源:中培IT学院

一、课程背景


ChatGPT,美国“开放人工智能研究中心”研发的聊天机器人程序  ,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。

OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。

ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题。然而,其在短时间内引爆全球的原因在于,在网友们晒出的截图中,ChatGPT不仅能流畅地与用户对话,甚至能写诗、撰文、编码。

ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,都会拒绝提供有效答案。

2022年11月底,人工智能对话聊天机器人ChatGPT推出,迅速在社交媒体上走红,短短5天,注册用户数就超过100万。

2023年一月末,ChatGPT的月活用户已突破1亿,成为史上增长最快的消费者应用。

对于企业来讲,学习ChatGPT原理,理解其应用场景,对于每一家企业都至关重要。

 

二、课程优势

内容价值定位:课程内容采用ChatGPT算法研发管理的方法论,结合企业自主创新产品研发技术和应用最佳实践。

实操性和互动性:培训过程中通过对实际角色演练、案例研讨等方式加深学员对所学内容的理解和实际转化能力。

讲师的专业性:AIGC算法领域的技术专家,有丰富的产品开发、架构设计及研发管理咨询经验。


三、课程收益

通过培训使学习者达到如下目标:

1. 掌握航线收益类常用算法案例与应用场景

2. 掌握排班算法

3. 掌握派工算法原理

4. 掌握值机柜台预测算法

5. 掌握动态票价设计算法


四、课程时长及对象

(一)培训时间:

1. 课程时长:1天, 共6课时,

2. 上课时间:上午9:00-12:00,下午14: 00-17: 00(可协商调整)

3. 学习时间:(提前10天预约老师)

(二)培训对象:

1. 公司IT相关技术人员;

2、企业技术总监及研发应用相关人员;

3、公司系统架构师、设计与编程人员;

4、对AIGC核心算法技术感兴趣的人员。


五、授课方式及特点

(一)培训方式:

1. 讲师激情、精彩演讲占40%

2. 行业案例分析占30%

3. 互动提问:讲师现场提问,学员做答,讲师点评占10%

4. 作业练习:现场练习和操作、表演展示占10%

5. 分组讨论:各小组给出答案,讲师点评占10%

(二)课程特色

l. 可操作性:聚焦于实际操作训练与实践能力提升 强互动讨论,贴近实战;

2. 系统提高:ChatGPT核心算法的技术原理与应用系统开发方法、开发工具使用方法 ;

3. 寓教于练:运用相关行业实际案例分析、通过类比和练习使学员掌握人脸设别深层的专业知识,获得较强的人脸设别应用系统的分析、设计、实现能力,让困惑得到解答。

六、课程内容

时间

知识模块

主要内容

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

6小时)

 

 

 

 

 

 

ChatGPT发展历程

一、ChatGPT的传承与特点

1.1 OpenAI家族

1.2 ChatGPT的主要特点

1.2.1 基于GPT-3.5

1.2.2 基于RLHF技术进行训练

1.2.3 可以主动承认自身错误

1.2.4 可以质疑不正确的问题

1.2.5 可以承认自身的无知

1.2.6 支持多轮连续对话

二、ChatGPT/GPT的原理

1.1 NLP

1.1.1 NLP与NLU的局限性

1.1.2 NLP技术的应用领域

1.2 GPT vs BERT

1.3 GPT-3模型

1.3.1 原始的Transformer和GPT模型的网络结构

1.3.2 输入与输出

1.3.3 编码

1.3.4 向量化

1.3.5 位置信息编码(Positional Encoding)

1.3.6 注意力机制(基础版本)

1.3.7 多头注意力机制

1.3.8 整体架构

 

 

 

 

ChatGPT的技术架构

一、GPT家族的演进

1.1 ChatGPT与GPT1-3的技术对比

1.2 人类反馈强化学习

1.2.1 InsturctGPT/GPT3.5GPT3的区别

1.2.2 InstructGPT要做什么

1.2.3 InstructGPT是怎么做的

1.2.4 如何训练一个Reward Model

1.3 TAMER框架与论文分析

 

 

 

 

 

 

ChatGPT的训练

ChatGPT的训练

1.1 训练监督策略模型:使用有监督学习方式,基于GPT3.5微调训练一个初始模型

1.2 训练奖励模型:收集相同上文下,根据回复质量进行排序的数据

1.3 采用PPO强化学习来优化策略

1.4 RLHF

1.4.1 RLHF第一阶段是针对多个候选摘要人工排序

1.4.2 第二阶段是训练排序模型(依旧使用GPT模型)

1.4.3 第三阶段是利用PPO算法学习Policy(在摘要任务上微调过的GPT)。

1.4.4 Deep Reinforcement Learning from Human Preferences

二、ChatGPT的局限

1.1 ChatGPT在其未经大量语料训练的领域缺乏“人类常识”和引申能力

1.2 ChatGPT无法处理复杂冗长或者专业大的语言结构

1.3 ChatGPT需要非常大量的算力
1.4 ChatGPT还没法在线的把新知识纳入其中

1.5 ChatGPT还是黑盒模型

三、ChatGPT的未来改进方向

1.1 减少人类反馈的RLAIF

1.2 补足数理短板

1.3 ChatGPT的小型化

 

 

ChatGPT的产业未来与投资机会

一、AIGC

1.1 AIGC

1.2 受益场景

案例ChatGPT做问答机器人

案例ChatGPT做文案助手

案例ChatGPT做新型搜索引擎

案例ChatGPT做简历写作

课程总结

综合讨论、答疑

标签: ChatGPT培训

相关阅读

近期开班