13 min read

ChatGPT 近期情报汇总

ChatGPT 近期情报汇总

什么是ChatGPT

ChatGPT 是由 OpenAI 开发并于 2022 年 3月推出的人工智能聊天机器人。它建立在OpenAI的GPT-3列大型语言模型之上,并使用监督和强化学习技术进行了微调,因此该模型也被叫做GPT3.5。
简单来说,chatGPT属于GPT语言模型的一种,它通过迁移学习的方式进行了模型优化,同时基于人类训练师(通过人工的方式进行模拟对话),使用强化学习的方式对语言对话进行优化,通过过滤器对敏感词和敏感对话进行过滤,从而达到了良好的对话效果。
但于此同时chatGPT也包含一些潜在问题

  • 1.基于数据的对话往往缺乏精准性,无法提供精准的数据来源
  • 2.聊天本身存在欺骗反应
  • 3.对2021年之后的数据了解有限
  • 4.回答结果强依赖提问准确性,不同语言的处理结果也不同

ChatGPT的获取方式(持续更新)

  • 海外直通车:https://chat.openai.com
  • 由于众所周知的地区限制,openAI的 ChatGPT 模型需要账号,地区配置,海外网络等各种条件,因此国内的一些镜像或者代理网站也可以体验部分ChatGPT的功能:
  1. https://chat.forchange.cn
  2. https://aigcfun.com
  3. https://askai.ws
  4. https://chat.moyunav.com
  5. https://chatforai.com
  6. https://www.scyu.app
  7. https://gpt.tool00.com
  8. https://fastgpt.app
  9. https://chater.lanyun1103.top
  10. CSDN-ChatGPT
  11. https://askai.ws/
  12. https://huggingface.co/spaces/FreeGPT/FreeGPT
  13. https://freegpt.one/
  • 一些收集可用的 ChatGPT 镜像的网站:
    https://www.ooopn.com/tool/chatgpt/

  • ChatGPT Pro:
    ChatGPT Pro 的付费账号需要提供海外的信用卡绑定,并且拒绝国内Visa支付,如果有更好的获取方法,麻烦联系博主😭

语言/文本模型的开发API

chatGPT 模型获取:gpt-35-turbo
chatGPT API获取:

https://platform.openai.com/account/api-keys

chatGPT 文档获取:

https://platform.openai.com/docs/guides/chat

当然基于API的二次开发在openAI是收费的,可以通过如下网站查询当前 API 的价格表

https://openai.com/pricing#image-models

当然可以想到的最常用的价格如下所示:

Model Usage
gpt-3.5-turbo $0.002 / 1K tokens

文本处理模型介绍

关于众所周知的chatGPT的模型
目前最为所有人所知的GPT模型为两种,一个是已经开发公众使用的openAI开放的chatGPT模型 gpt-35-turbo,一个是bing团队最新集成的还在测试中的New Bing 聊天模型根据已知的情报,微软团队确认该模型为GPT-4。

GPT-4来了

GTP-4是OpenAI在深度学习扩展方面的最新里程碑,他是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实场景中不如人类那样具有能力,但在各种专业和学术基准测试中表现出与人类水平相当的性能。
根据 OpenAI 团队自己的测试对,在拟人类的专业考试当中,GPT-4 表现出了比 GPT-3 更好的能力,并且在相关的性能和可靠性测试中也表现出了更好的结果。
更重要的是,相比于 GPT-3 中仅能处理文本语言模型来讲,GPT-4支持图像处理,这是否意味着视频输入也讲成为GPT-4处理的一种可能。关于GPT-4具体的情况可以在如下地址中找到:

https://openai.com/research/gpt-4

当然目前的 GPT-4 还没完全开放,可以通过如下信息进行预约 GPT-4预 约 地 址( waitlist ):

https://openai.com/waitlist/gpt-4-api

不得不说,希望AI真的可以change the world,预约起来!

OpenAI 模型类别如下:

  • GPT-4 Limited beta
    一组模型,它们在GPT-3.5的基础上进行了改进,并且能够理解并生成自然语言或代码。
    A set of models that improve on GPT-3.5 and can understand as well as generate natural language or code
  • GPT-3.5
    一组模型,它们在GPT-3的基础上进行了改进,并且能够理解并生成自然语言或代码。
    A set of models that improve on GPT-3 and can understand as well as generate natural language or code
  • DALL·EBeta
    能够根据自然语言提示生成和编辑图像的模型。
    A model that can generate and edit images given a natural language prompt
  • WhisperBeta
    一个可以将音频转换为文本的模型。
    A model that can convert audio into text
  • Embeddings
    一组可以将文本转换为数字形式的模型
    A set of models that can convert text into a numerical form
  • CodexLimited beta
    一组可以理解和生成代码的模型,包括将自然语言翻译成代码
    A set of models that can understand and generate code, including translating natural language to code
  • Moderation
    一个经过精细调整的模型,可以检测文本是否可能敏感或不安全
    A fine-tuned model that can detect whether text may be sensitive or unsafe
  • GPT-3
    一组可以理解和生成自然语言的模型
    A set of models that can understand and generate natural language

这里推荐下与OpenAI强关联的MicroSoftware公司下属的云服务Azure提供的模型能力,即Azure OpenAI,显然至少在语言模型上OpenAI和微软在领先的
Azure OpenAI

  • Davinci
    从模型角度讲,达芬奇模型能力强大,复杂文本场景场景表现最好。对于需要深入理解内容(例如为特定受众进行摘要和创意内容生成)的应用程序来说,达芬奇产生了最好的结果。由达芬奇提供的增强功能需要更多计算资源,因此达芬奇成本更高,并且不如其他模型快速。
  • Curie
    Curie很强大,但速度也很快。虽然Davinci在分析复杂文本方面更强大,但Curie可以完成许多微妙的任务,如情感分类和摘要。 Curie还擅长回答问题、执行问答和作为一般服务聊天机器人。
  • Babbage
    巴贝奇可以执行简单的分类等基本任务。在语义搜索方面也很强大,能够评估文档与搜索查询的匹配程度。
  • Ada
    Ada通常是最快的模型,可以执行解析文本、地址校正和某些不需要太多细微差别的分类任务。通过提供更多上下文信息,可以进一步提高Ada的性能。
  • Codex
    Codex模型是我们基于GPT-3模型的后代,它们可以理解和生成代码。它们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。

Prompts 库资源

什么是prompt?

ChatGPT 的回复质量取决于提示词(即 Prompt)。 这通常是用户提供的问题或文本,以激活模型生成回复。 简单来说,prompt 就是用户想要询问的内容,作为输入送到 ChatGPT 中,ChatGPT 会尝试理解这个输入,然后输出合适的回答或响应。
简单来说,如何从chatGPT获得想要知道的信息或者答案这件事,不仅仅取决于模型本身的准确性,模型的读取数据范围,模型的检索能力外,还取决于用户的提问方式。如何描述当前发生的场景并提出有效的问题,将从用户端决定获取信息结果的准确性。
为了适应chatGPT解析问题的范式,提示词甚至会变成某种可以应用到特殊场景的GPT规则或者是GPT语言,从而影响chatGPT的回复质量

现有的Prompts库情报

现有针对可能存在的不同问题场景,prompt也变成了一种针对GPT的使用资源可以进行统计,收集和传播。现有的已经发现可以得到良好回复质量的 prompts 库如下:

  • 官方 prompts 案例
    https://platform.openai.com/example
    不要多说什么,官方教程,教你最基本的提问技巧,体验针对不通场景的关键词和提问模板
  • awesome-chatgpt-prompts
    https://github.com/f/awesome-chatgpt-prompts
    这是用于 ChatGPT 模型的提示示例集合, 一个github的明星项目,基本包含了当前探索过的大型语言模型的各种场景,用于可以将对应的提示词加入自己的词库中,从而润色自己的问题。也可以基于现有的Prompts库,让AI生成针对不同问题的独立提示。显然,提示词本身也可以作为训练数据生成更多的提示词。
  • Learn Prompting
    https://learnprompting.org
    关于与人工智能通信的免费开源课程,该site讲述了如何认识prompt,了解基本的LLM原理,学习如何成为一个优秀的 prompt 工程师。在可见的将来,基于如何更好的挖掘大型语言模型在各种场景的极限能力,prompt 工程师将成为产品竞争力的核心关键。
  • ChatGPT Shortcut
    https://newzone.top/chatgpt/
    一个收录ChatGPT快捷指令的工作库,将在发起问题时自动展示当前库中收录的各种提示词。使用者在构思问题时自动弹出相关prompt,是一个优秀的ChatGPT生产力加倍工具。
  • dair-ai/Prompt-Engineering-Guide
    https://github.com/dair-ai/Prompt-Engineering-Guide
    这是一个最新的 Prompt-Engineering (提示工程) 指南,它是一门相对较新的学科,用于开发和优化提示,以有效地将语言模型 (LM) 用于各种应用程序和研究主题。及时的工程技能有助于更好地了解大型语言模型 (LLM) 的功能和局限性。研究人员使用即时工程来提高LLM在各种常见和复杂任务(如问答和算术推理)上的能力。开发人员使用提示工程来设计与LLM和其他工具交互的强大而有效的提示技术。在这份指南中,你将接触 few-shot, 思想链 CoT, zero-shot CoT,自洽性,对抗性提示等 Prompt 的基本概念,了解如何用程序辅助生成问题。
  • 让 ChatGPT 本身给你润色你的问题

ChatGPT的最新应用(持续更新)

  • 搜索引擎 (推荐指数 5星)
    New Bing
    显而易见的是基于 ChatGPT 出色的信息收集速度和已知的信息总结能力,ChatGPT 将成为另一种类型的搜索引擎,相比传统的搜索引擎,ChatGPT 能够提供实时问答式的信息反馈,显然人类传统的问题更适合基于上下文语意的不断问答。这意味着每个人都将拥有一个实时的老师,这要比现有的搜索引擎更贴近广泛的人群,有理由相信传统的搜索引擎将成为专业领域的第二入口,而ChatGPT式的问答搜索引擎将成为普通用户的第一入口。
  • 语言翻译 (推荐指数 5星)
    AI-Tanslate(yetone/openai-translator),github库地址如下
    https://github.com/yetone/openai-translator
    github的一个正在快速成长项目,当选择用大型语言模型作为翻译机器的时候会发生什么,相同的场景下,类似GPT等大型语言模型不仅仅对词语提供翻译,还会对得到的句子进行润色。GPT在各种语言场景下的准确度本身就在不断得到越来越多的认可,而于此颠覆当前翻译软件的格局可能在当下,就在当前正在起步的阶段。除了准确的翻译自然语言外,openai-translator甚至可以帮助开发者去阅读不熟悉语法规则的编程语言,甚至时机器语言等。
  • 专业助手 (推荐指数 3星)
  • 编码助手 (推荐指数 4星)
  • 对话练习 (推荐指数 4星)
  • 语法润色 (推荐指数 4星)
  • 知识问答 (推荐指数 4星)
  • pdf总结 (推荐指数 5星)

chatGPT个人理解

我们该如何评价 ChatGPT 带来的生产力提升

我们现在缺乏一整套关于在生产环境中使用 ChatGPT 可能带来的潜在能力的提升,因为至少良好的使用prompts通过 ChatGPT 解决工程问题或者提升生产效率的能力还远远没有广泛的普及。整个工程体系也缺乏对 ChatGPT 带来生产力提升的评价。但比较明确的是,一个熟练使用 ChatGPT 进行生产的某项工程师将比同阶段不使用 ChatGPT 的工程师产生的价值产生较大差异。一个比较通俗的想象是,在搜索引擎不存在的阶段里 Programer 开发的效率,和当前同水平 Programer 在基于已有工具和轮子的开发效率对比。
我们现在就只是缺少已发生案例的记录,和ChatGPT科学的生产力量化评估。在未来的每一个人都将会去学习如何使用Prompt,就像学习如何使用excel一样

因为 ChatGPT 的出现,如何安全的使用每个实体的数据将成为关键

大型语言模型在数据的检索,统计,收集方面已经出现新一轮的变革,每个人可能都将获得一份独特的智能助手,但显然人们期望的是该语言模型仅能获取所在范围内的数据,并且基于数据的训练需要变得可以控制,重新训练的模型应该可以被注销。可见的数据的交换也将变得更加频繁,交换之后的数据隐私问题也将获得越来越多的重视。如何在现有场景安全的交换数据,将数据交换控制在使用者的最小范围内,甚至数据超出使用者的控制边界外仍然可以获得数据的控制权将成为更加值得关注的问题。

如果你能获得ChatGPT,畅想一下它可能会是什么样子

情感模拟机器人

如果说把你交往三五年的前女友/男友的聊天记录当成数据,让大型语言模型进行模拟呢?

游戏真实NPC

如果说游戏的每个NPC都有自己基于背景的独特对话,每个玩家将获得完全不同的游戏体验呢?

未完待续

关于下一期

下一期想把不仅是语言模型的AI工具分享出来,是时候写一篇AI的工具箱了。