提示工程:方法、技巧与行业应用 计算机企业核心技术丛书
定 价:85 元
本书是揭示大语言模型背后技术奥秘的金钥匙,从宏观到微观全方位解读AI创新世界,帮助读者释放创造力、解放生产力、提升技术力。 本书的第1章和第2章聚焦大语言模型本身以及提示工程的兴起,能够让读者对大语言模型技术的发展背景、概念以及应用场景等有较为全面的了解。第3章,则是结合当下火热的AIGC话题展开介绍,为读者提供AIGC图像生成的实战体验,帮助读者快速上手,更好地感受和理解当前AIGC和提示工程的强大威力。第4章和第5章,从实操角度为读者提供丰富的提示工程基本技巧和进阶技巧,并探索大语言模型的高阶玩法,如编程、插件、函数调用等,帮助读者解锁大语言模型深层次的应用潜力。第6章、第7章和第8章,针对提示工程在搜索、Microsoft 365,以及法律、金融、医疗等多个领域及行业的具体应用展开介绍。 本书的每一章都可独立成话题,相信通过阅读本书,您将对大语言模型、提示工程技术有更加全面的了解
1. 中国工程院院士郑纬民作序!微软全球资深副总裁张祺博士领衔微软(亚洲)互联网工程院数十位资深大模型专家倾力打造!
2. 本书结合LLM、Copilot、AIGC等场景中提示工程的成功案例,全方位展现现阶段提示工程的发展状况及实践应用。3. 本书揭示大语言模型背后技术奥秘的金钥匙,从宏观到微观全方位解读AI创新世界,帮助读者释放创造力、解放生产力、提升技术力。
前言抓住开启AI创新世界的金钥匙 2023年伊始,微软全球CEO萨提亚·纳德拉在瑞士达沃斯参加世界经济论坛时表示:AI的黄金时代已经到来。 作为一名从事机器学习、大数据、人工智能算法研究与开发工作超过20年的计算机工程师,看到ChatGPT、大语言模型、AIGC仿佛在一夜之间成为家喻户晓的热词和全球关注的焦点,我感到既欣慰又兴奋, 与之俱来的,还有一种时不我待的紧迫感。 历史告诉我们,科研突破往往不会立竿见影地造福人们的社会生活:在蒸汽机发明大约一个世纪之后,人类才真正迎来了第一次工业革命的大潮;从需要一组人不断接线才能使用的第一台电子计算机到实现每个人桌上有一台PC的梦想,也经过了差不多50年的时间。 今天的我们,对于这一轮AI技术革命的期待要迫切得多:令人惊艳的第一印象,让整个世界对大语言模型寄予了厚望,从全球经济、行业发展到企业创新,乃至每个人的职业生涯和生活体验,人们迫不及待地希望AI能够开启一扇通向无限创新的大门。正因如此,准确地激发大语言模型和AIGC的最大潜力,让颠覆性的技术变革在第一时间产生最大效益,成了我们这些AI从业者的当务之急。 这也是驱动我们编写本书的动力。我们相信,本书所探讨的主题提示工程,将成为引导更多人开启AI创新世界的一把金钥匙。 大语言模型把人工智能从专属于开发者、程序员、工程师的技术词汇,变成了每个人手机和计算机上触手可及的智能副驾。大语言模型几乎无所不能,它不但为人工智能的普及开辟了新的路径,让没有任何编程基础、算法知识的普通人,也能用自己最熟悉的自然语言与模型交谈,借助AI的智慧来搜索信息、撰写文章、绘制图画、编写代码,而且改变了我们创新、投资的路径和模式,让每个人都有机会成为一人即团队的单人创业家。 驾驭大语言模型的关键,在于学会如何提问正如现代心理学奠基人卡尔·荣格所说:正确的提问,已经解决了一半的问题。今天,经过良好训练的大语言模型能够通过对语言的量化分析,读懂人类的意图,但同时我们也发现,模型的输出并不总是符合我们的预期。有时,同一个问题,仅因为表达方式的微小变化,模型的回答可能就会大相径庭。这带来了一个问题:如何确保我们能更精确地获取模型的预期输出呢?答案就是提示工程用循循善诱的方式让AI更高效地产出更准确的结果,这也是我们希望能通过本书完整阐释的课题。 本书最大的特点在于注重实战,编写团队成员是来自微软(亚洲)互联网工程院的十几位工程师、科学家,其中不乏引领当今全球人工智能与大语言模型研究前沿的领军人物。在内容上,本书以大语言模型研究及人工智能范式的沿革为背景,致力于从发展历程、技术原理、实用技巧、应用场景等不同维度出发,结合ChatGPT、Copilot、AIGC等场景中提示工程的实际应用和成功案例,向读者全方位展现现阶段提示工程的发展状况。同时,书中还围绕大语言模型及提示工程在法律、医疗、金融等领域的最新实践案例及其面向未来的潜在商业机会进行了充分探讨,希望能够激发读者的更多创新灵感。 作为人工智能领域的研究者,我们参与和见证了AI技术迭代发展的曲折历程,有幸迎来了今天大语言模型爆发式发展的黄金时代。与此同时,我们更希望能让更多来自行业之外的企业家、创业者、爱好者等,感受并参与到这场技术变革之中。 我们由衷地希望本书能够帮助大家从提示工程入手,学习、理解和驾驭大语言模型,循序渐进地构建面向AI时代的思维逻辑和创新范式,从而真正激发出AI技术的最大潜能!
张祺博士现任微软全球资深副总裁,负责微软互联网业务及人工智能平台团队,服务微软全球的业务和用户。他在人工智能、机器学习、大数据、大语言模型、分布式计算等领域成绩斐然,领导建立了微软广告、必应搜索、Edge浏览器、大数据、知识图谱、商用人工智能、人工智能平台团队,为Office和Azure产品的数据化和智能化奠定了坚实基础,并建立了微软搜索商业化体系,在短短数年即创造了数百亿美元的业务营收。在人才培养和团队发展方面,张祺博士注重成长型思维和开拓型创新,为微软培养了一支多元化和充满创新活力的优秀团队。张祺博士于2002年加入微软美国总部,2014年成为微软全球合伙人,2018年被授予微软全球杰出工程师荣誉,成为微软中国首位获此技术专家荣誉的工程师。
序言前言第1章 认识大语言模型和ChatGPT 11.1 大语言模型基础 11.1.1 什么是语言模型 11.1.2 语言模型的历史 41.1.3 基础语言模型的种类 51.1.4 基础语言模型的训练和评估 101.1.5 什么是大语言模型 141.2 大语言模型的类型 151.2.1 从左到右大语言模型 151.2.2 掩码语言模型 161.2.3 前缀语言模型和编码器解码器结构 171.3 初识ChatGPT 181.3.1 ChatGPT的原理 181.3.2 ChatGPT的应用 241.3.3 ChatGPT的挑战 271.4 其他大语言模型 29第2章 人工智能范式的变迁与提示工程 322.1 人工智能范式的变迁 322.1.1 人工智能模型及其训练 322.1.2 人工智能范式的变迁详解 342.2 提示工程的兴起 402.2.1 提示学习 412.2.2 提示学习的研究领域 442.2.3 蓬勃发展的提示工程 522.2.4 提示工程的特点与优势 562.2.5 提示工程的局限、挑战及探索 57第3章 AIGC中的提示工程 593.1 全面认识AIGC 593.1.1 AIGC的诞生和发展 603.1.2 AIGC引起内容生成范式的变迁 613.1.3 提示词与AIGC 613.2 AIGC的类别、原理及工具 623.2.1 文本生成 633.2.2 代码生成 643.2.3 图像生成 653.2.4 视频生成 673.3 AIGC的影响 683.3.1 AIGC对各行各业的影响 683.3.2 提示工程师的诞生 693.4 AIGC图像生成与提示工程 703.4.1 Stable Diffusion的提示工程 703.4.2 Midjourney的提示工程 793.4.3 实战:利用ChatGPT和Midjourney完成广告文案和图像的生成 81第4章 提示工程的基本思路和技巧 854.1 提示工程基础知识 854.1.1 提示工程的基本思路 854.1.2 提示工程的特点 874.1.3 提示调试涉及的因素 904.1.4 提示效果评估 924.1.5 工具和资源 934.2 提示工程基本技巧 944.2.1 上下文信息和指令 954.2.2 角色扮演 994.2.3 从零样本到少样本 1014.3 提示工程进阶技巧 1044.3.1 思维链 1044.3.2 自洽性 1064.3.3 由少到多 1094.3.4 生成知识提示法 1114.3.5 自动提示生成 1144.3.6 其他进阶方法简介 115第5章 ChatGPT中的提示工程 1195.1 ChatGPT的基本模型设置 1205.2 提示词的基础知识回顾 1205.2.1 提示词格式 1215.2.2 提示词要素 1225.2.3 设计提示的通用技巧 1225.3 文本任务 1245.3.1 文本概括 1245.3.2 信息提取 1255.3.3 文本分类 1265.3.4 问答 1275.3.5 对话 1275.4 编程 1285.4.1 代码生成 1295.4.2 代码调试 1305.4.3 单元测试 1315.5 插件 1325.5.1 ChatGPT插件功能使用 1325.5.2 ChatGPT插件功能开发 1355.5.3 代码解释器 1385.6 函数调用 1425.6.1 函数调用功能使用 1435.6.2 函数调用应用场景 146第6章 搜索领域的提示工程应用 1486.1 新必应及其聊天体验 1486.1.1 新必应简介 1486.1.2 全新的聊天体验 1506.1.3 必应普罗米修斯模型 1566.2 检索增强的大语言模型 1586.2.1 大语言模型的幻觉问题 1586.2.2 检索增强的大语言模型框架 1606.2.3 开源实例 1616.3 大语言模型增强检索 1686.3.1 神经向量检索 1686.3.2 相关性重排 1716.3.3 数据标注 1736.4 搜索新场景 1746.4.1 必应故事 1746.4.2 必应知识卡片2.0 176第7章 Microsoft Copilot中的提示工程 1787.1 Microsoft 365 Copilot概览 1787.1.1 Copilot中的提示 1787.1.2 Copilot系统 1797.2 Word Copilot 1817.2.1 Word Copilot基本功能 1837.2.2 Word Copilot提示交互的基本原理 1847.2.3 典型交互类型与提示实例 1867.3 PowerPoint Copilot 1887.3.1 PowerPoint Copilot基本功能 1897.3.2 PowerPoint提示交互的工作流程与示例 1907.3.3 典型交互类型与提示实例 1947.3.4 PowerPoint的渲染与样式Designer 1967.4 Excel Copilot 1997.4.1 Excel Copilot基本功能 2007.4.2 基本原理 2017.4.3 提示实例 2027.5 其他应用 2047.5.1 Teams Copilot基本功能与提示实例 2047.5.2 Outlook Copilot基本功能与提示实例 2077.6 应用实战 2097.6.1 题目描述 2097.6.2 Azure OpenAI 快速入门 2097.6.3 参考答案 210第8章 提示工程的行业应用 2128.1 大语言模型对各行业的影响 2128.2 法律行业的应用 2138.2.1 法律行业的需求背景和潜在机会 2138.2.2 法律行业的产品案例 2148.2.3 典型应用场景(一):起草法律合同 2168.2.4 典型应用场景(二):法律论证 2218.3 医疗行业的应用 2238.3.1 医疗行业的需求背景和潜在机会 2238.3.2 医疗行业的产品案例 2248.3.3 典型应用场景(一):医疗询诊 2268.3.4 典型应用场景(二):医学影像 2328.4 金融行业的应用 2348.4.1 金融行业的需求背景和潜在机会 2348.4.2 金融行业的产品案例 2358.4.3 典型应用场景 2358.5 应用实战:基于ChatGPT的医学询诊 2518.5.1 环境配置 2528.5.2 数据下载和处理 2538.5.3 编写提示完成问答功能 2548.6 应用实战:基于ChatGPT的跨境电商营销和运营 2578.6.1 广告营销 2588.6.2 销售运营 2608.6.3 独立自建站 262参考文献 264