未来似乎已来临

作为一名前沿科技爱好者,在2022年10月的某一天,也许是逛GitHub无意中看到,有什么代码补全工具,AI智能分析上文代码意图逻辑,编写后续内容,这也许是ChatGPT能够爆火的前兆,当时基本上我所在的所有程序员群里都谈论交流,我目光就锁定了GitHub copilot(当时程序员群里较为爆火)我大概搜了背景,初步认识了OpenAI这个勉勉强强字面上读得懂的词汇,然后我就联想到我之前申请GitHub学生包里面Microsoft Azure管理员面板里有这个OpenAI可以调用api。(离ChatGPT的就是这么近)嗯,但是水平不够,手头机器性能不足,就没搞深度学习,卷积神经网络训练,不然还是有兴趣可以去研究一下。

ChatGPT

其实在真正使用ChatGPT之前,我还误认为,OpenAI的playground就是ChatGPT,纯生成式的开放人工智能平台,他的优势是可以切换模型,可以更改一些模型个性化的设置,我推测应该是跟算法离散性有关,而且他好像默认调用api,(目前有三种账号:120刀,18刀,5刀体验金)使用api要收费的。

进入正题,ChatGPT,界面就是对话框的形式,很早之前普通账号免费,没有限制,模型使用GPT3,为此在OpenAI官网上当时有专门为了开发者申请调用GPT3 api接口的链接,但后来人数激增,普通账号开始有一个小时内对话问题次数限制,并开始了收费服务plus版本,月付20美元,优先线路,并且模型优化为GPT3.5,同时也开始了GPT3.5的api内测申请,API的价格是GPT3的十分之一,目前最近网页版ChatGPT也更新了最新GPT4.0版本,也同步了api的申请通道。

按照我让他生成如何去评价一款对话式聊天人工智能的的评价指标,来评价他

评价ChatGPT可以从多个维度和功能性方面来考虑,以下列出了一些建议的评价指标:

  1. 生成文本的质量:ChatGPT生成的文本在语法、句法和语义上都比较正确,输出结果也比较流畅和连贯。当然,也有可能出现错误或无意义的答案。
  2. 对话理解能力:ChatGPT对用户输入的理解程度很高,它能够准确捕捉用户的意图并作出恰当的回应。它还能回答跟进问题、承认自己的错误、挑战错误的前提和拒绝不合适的请求。
  3. 多样性:ChatGPT生成的回答具有一定程度的多样性,避免出现重复或单一的答案。但是,它也有时会过度使用某些短语,例如重复说明自己是一个由OpenAI训练的语言模型。
  4. 适应性:ChatGPT是否能够根据不同领域、场景和用户需求进行调整,以满足多样化的应用场景,这一点我不太清楚。我猜想它可能需要更多针对特定任务或领域的数据和训练才能做到这一点。。
  5. 可控性:ChatGPT生成结果是否具有可控性,包括调整生成文本的风格、长度、复杂性等方面。我想这可能取决于OpenAI提供给开发者和用户使用API时候设置了哪些参数和选项。
  6. 安全性和道德风险:ChatGPT在回答敏感话题时一般是回避回答,但有心之人经过诱导后的预设下,他还说不受控的回答带有偏见的答案。
  7. 零样本学习能力:ChatGPT展现出了零样本学习的能力,即可以在没有任何样本的情况下完成新的语言任务。。
  8. 易用性:ChatGPT的接口和调用,对于一般经验的开发者来说,算是简单易用,且有官方文档。
  9. 能耗和计算效率:GPT3.5 的训练使用了微软专门建设的AI计算系统,由1万个 V100 GPU 组成的高性能网络集群,总算力消耗约 3640 PF-days (即假如每秒计算一千万亿次,需要计算3640 天)。。
  10. 社会影响:目前来看所谓的替代人工的能力还有待商榷,能大幅度提高工作效率这是肯定的。

 

New Bing

我应该算是new bing最早一批加入内测使用功能的用户,2023年2月8号开放申请,2月9号晚拿到资格,在10号和11号测试时,bing AI的能力简直令人惊艳,

在刚出的那几天,体验是远超ChatGPT的包括plus版,因为ChatGPT是纯生成式的,无法实时更新信息,会犯很多事实上的错误,new bing就根据你搜索关键字来搜索网络上开放浏览的网页,并且从数据库与搜索到的网页相关内容训练自己的生成结果,从准确度上提高,并且实时性非常适于AI搜索引擎,他就像一个AI助手一样及时给你一份需要搜索的资料,并且已经整理归纳好了,并且其中我还探索到这个结合ChatGPT技术的AI搜索引擎,是一个多模态模型,支持语音输入,支持图片,文字,音频,动态壁纸的输出,当然没体验到几分钟,这个多模态的功能就悄无声息的封了。我推测可能他能力太强悍了,后来一直在削弱,生成式的内容砍了很多,得到的更多是搜索引擎搜索的直接结果,因为有国外用户用心诱导,使这个人工智能有点向不可控的方向发展,官方索性就是直接砍了连续对话问题数量和一天之内所能产生会话的数量,质量和数量都被大砍,但他依旧还是比较强大的搜索引擎智能AI。

  1. 生成文本的质量:new bing与ChatGPT某些技术层面是相同的,但new bing具有联网的实时性,生成的文本在语法、句法和语义上都基本与ChatGPT差不多,输出结果也比较流畅和连贯。不过在出现错误或无意义的答案概率上降低不少。
  2. 对话理解能力:与ChatGPT一致,new bing对用户输入的理解程度很高,它能够准确捕捉用户的意图并作出恰当的回应。它还能回答跟进问题、承认自己的错误、挑战错误的前提和拒绝不合适的请求。
  3. 多样性:new bing生成的回答具有一定程度的多样性,避免出现重复或单一的答案。。
  4. 适应性:new bing目前有三种以满足不同的应用场景的模式,(更具有创新,更具有平衡,更具有精确)。
  5. 可控性:new bing已经对问题敏感度加以控制,这个方面比ChatGPT限制要强的多。
  6. 安全性和道德风险:new bing在回答敏感话题时一般是直接让你返回新主题会话,诱导难度比ChatGPT大,带有偏见的答案很难生成。
  7. 零样本学习能力:new bing通过关键词搜索,结合搜索结果训练生成。
  8. 易用性:暂无官方可调用该API的文档。
  9. 能耗和计算效率:暂无数据。
  10. 社会影响:可以为人们在搜索中节省浏览时间,对网页信息的整合,能大幅度提高工作效率。