陈腾将ai部门负责aigc部门的负责人给喊了过来。所谓aigc,是artificialtellinceneratedntent的首字母拼音。翻译过来,就是“人工智能生成内容”。顾名思义,aigc这类ai的作用,就是生成一些内容。2022年以后大火的gpt,就是最广为人知的aigc。除此之外,还有ai作画、ai生成视频,都在aigc的范畴之中。在aigc大火的时候,许多人认为一个全新的时代将要到来。画画、写作、作曲……这类创作性的工作,由ai就能够完成。然而理想很丰满,现实很骨感。陈腾在这些ai工具大火的时候,也玩过几次。只不过再尝试几次之后,就会发现这些ai工具存在着重大的缺陷。文字类ai生成的内容牛头不对马嘴。上一秒说过的话,下一秒就会忘记,记忆短得像是七秒钟记忆的鱼一样。在算力达到一定程度之前,ai对于上下文内容的记忆能力永远都小得可怜。不过用来写些没什么意义的检讨、总结、日报周报,还是相当不错的。以及在写代码的时候,生成一些简单的代码。图片类ai生成的内容同样存在一些问题。比如说早期一直被诟病的手部细节,比如说只能生成动漫类型的图片。一旦生成写实类的图片,就会显得非常失真。用来做辅助工作还行。要是想要靠ai独立地完成一些任务,还有很长的路要走。2022年的ai水平尚且如此,2015年的ai水平就更加不用说了。不过现在能迈出第一步,陈腾还是非常感兴趣的。“老板,您找我?”眼前的男人四十岁不到,叫做魏龙,是国内人工智能领域的一位专家。他从腾达做手机语音助手的时候,就来到了腾达。在语音助手这一块,做了相当多的工作。技术水平是有口皆碑的好。“对,我听朱岩哲说你们推出了一个aigc的测试版本?”“是的,目前我们的对话大模型暂命名为dh,版本号为01。”“dh?”“对话的首拼。”“原来如此。”陈腾笑了笑,“那这个dh01现在大概处于什么样的水准?”“对话的智力水平……大概只有幼儿园小朋友的水平吧。”陈腾微微点头。这个水平,的确不高。也难怪版本号是01,而不是10。“你觉得如果我们这个dh01如果需要提升,目前最欠缺的是什么?”“数据。”魏龙毫不犹豫地回答道,“绝对是优质的数据,我们这个模型的水准还是不错的,就是数据实在是太少了。”“数据吗……”陈腾倒是没怀疑魏龙说的模型水准。因为这个dh模型的基础,其实是【ls人工智能语言学习大模型】。就是陈腾上次五连抽,在系统上抽到的那个。系统出品,怎么都不会太差劲的。在抽到这个大模型之后,魏龙手下的技术团队又基于这个模型做了一定程度上的改进。所以模型水准陈腾是非常信任的。不过模型的学习能力强是一回事,数据又是一回事。如果将模型比作一个人,优秀的模型就是天赋很高的天才。可就算是顶级的天才,没有高质量的学习资料,能学到的东西也有限。现在腾达的这个dh模型,缺乏的就是学习资料。“我们现在的数据源有哪些?”“就是各大平台上网友们交流的一些数据,比如短视频平台的评论区,直播平台的弹幕。不过这些数据的质量,实在是太低了。”陈腾微微点头。魏龙说的很有道理。短视频平台的评论区,有相当多的一部分评论都是没什么意义的回复。这个没意义,指的是对ai训练没意义。比如颜值博主的评论区什么“好美”“好漂亮”的夸赞。对于ai训练来说,意义不大。经过筛选处理过后,能用的数据少得可怜。陈腾又想到了gpt。实际上第一代的gpt是在2018年推出的。但是第一代的gpt在市场上,并没有搅动什么风云。因为智能水平太低了,根本没有人乐意与这样的ai对话。直到四年之后,足足喂了四年的数据,这才有了许多人愿意对话聊天的gpt。可见ai的学习与发展,是一条十分漫长的路。“如果按照现在的学习速度,你觉得我们的ai需要多长的时间,才能通过图灵测试?”所谓图灵测试,就是让一个人去问ai问题。看看这个人,能否发现正在与自己聊天对话的是ai。小主,这个章节后面还有哦,,后面更精彩!能发现是ai,则未通过图灵测试。未能发现是ai,则通过图灵测试。这个测试方法在学术界具备一定的争议。有人觉得这是一个很好的测试手段,有人则觉得这种测试手段没什么必要。但是不管怎么说,图灵测试都可以作为一个ai智能程度的一个指标。能通过图灵测试的人工智能不一定特别有用,但至少具备一定的智能程度。“如果按照现在的学习速度,通过图灵测试的话大概需要两年吧。如果数据的量充足且优质,也许两三个月甚至更短的时间就能通过图灵测试了。”魏龙有些无奈地说道。优化模型、输入数据。他们搞人工智能的,无非就是在做这两件事情。“我倒是有一个想法,可以试一试,我们可以在互联网上,将dh01伪装成普通的用户,让真人用户和dh01对话试试。”“可是dh01现在的水准,恐怕和正常人聊上几句,就会让人觉得聊天内容牛头不对马嘴了。”“那有什么关系?”陈腾反问,“你现在上网去和人讨论问题,牛头不对马嘴的情况难道遇到的少吗?”魏龙:“……”还真别说,他确实在互联网上见证过生物多样性。“那我们就伪装成真人,去和用户聊天?”“嗯,你去找蒋华,让他配合你们弄些人机账号出来吧。”“好的。”“什么时候你们觉得这个对话模型有资格被称之为dh10了,我们就向用户正式开放我们这个对话模型。”“如果能和大量真人进行对话,我觉得一年以内,甚至半年的时间我们就能达到10版本。智力水平,应该有七八岁小孩子这么高。”“那还不错。”陈腾对七八岁小孩子的智力水平还是认可的。至少能对话了。如果在这个基础上再进步,那就真的可以商业化了。:()游戏公司?这分明是科技巨头