来源:趣玩责编:网络时间:2024-06-18 16:37:00
这两年大模型很流行,那么大模型的现状如何呢?
从全球范围来看,OpenAI 在通用大型模型领域依然占据主导地位,但也有其他生态系统,比如擅长长文本的Claude、开源冠军Llama、开源新人Mistral、开源之王Midjourny绘图.整个地区都很繁荣。
评估大型号首先看重什么?参数、尺寸、价格、榜单排名?也许仅这些还不够。只有大型模型能够真实地运用到人们的生活和工作中,并且稳定无差错,那才是万千企业和用户最关心的话题。
在当今的大型模型世界中,必须再次使用古老的程序员格言“空谈是廉价的,向我展示代码”。
用起来,这才是正确的方法。
现在,如果你打开字节跳动旗下的口子AI平台,你会看到数百个机器人参与激烈的PK。
自2024年2月1日上线以来,口子已接入国内多家著名大型语言模型,包括豆宝、统一千文、智浦、MiniMax、Moonshot、百川等。 ——有琳琅满目的大型号“货架”,有大型号、小号、中号、大号。
可以说,民间专家基于这些模型开发的应用种类繁多,例如学习英语、编程、复印、算命等。但在这种情况下最好的使用方法是什么?
Button Model Square 提供了一个简单直接的比较和评估平台。
对于小红书博主来说,可以直接一键打开小红书文案生成器,有两个不同的大模型,进行实时测试和比较。
两个机器人都使用相同的提示和插件,但实时测试可以轻松查看它们的比较情况,无论是响应速度还是返回的内容。
和游戏一样,按钮模型广场提供了多种有趣的玩法,包括指定机器人对战、随机机器人对战、纯模型对战等。
例如,在随机战斗中,系统随机选择机器人进行模型战斗。适用于评估任何业务场景下评估模型的文本生成、技能和知识回忆能力。 ——PK 的两个模型都是匿名的,并且基于机器人提示、工作流程、知识库和其他回答用户问题的功能配置。
PK过程完全暴露给用户。来观光的用户可以通过模型对战的方式与两个隐藏模型的机器人进行实时对话,并根据模型的答案进行投票。确切的型号在投票结束之前不会公布。
PK不仅仅基于用户投票。结果发布后,用户可以展开结果页面查看两个模型的详细配置,包括世代多样性、世代随机性等配置参数。
从2022年底ChatGPT的爆发,到Sora、Midjourney等多模态模型的惊人成绩,再到Button模型广场的推出,这绝对是一次大模型生态系统向应用层的“远征”。成熟度—— 人们不再谈论数字,而是开始考虑可用性。整体来看AI领域的发展趋势,这也是大模型新技术向ToC方向迈出的重要一步。
回顾人类科技史,我们发现模型越大,技术就越能更快地达成全社会的共识“这是一项真正能够提高生产力和生产力的新技术”改变社会。”这样的人会很少。未来。
从ChatGPT之后的GPT-3.5到GPT-4以及最新的GPT-4o,流行的大型模型在过去两年中经历了过山车般的发展速度。领先的模型和芯片制造商仍在共同努力改进模型并探索缩放定律的极限(不断增加参数尺度和数据量以获得更强大的模型能力)。仅测量参数数量,GPT-3.5 就有1760 亿个参数,截至今年仍然是一个闭源模型,但人们可以使用的最先进的开源模型Llama 3 拥有超过4000 亿个参数。
与土壤一样,更大的参数和数据量是模型功能的基础,但测试的是哪些应用程序可以在土壤中生长,无论是苔藓还是参天大树。
具有数千亿参数的模型往往可以展示尖端技术,而当今的模型创新者正在努力使他们的模型小型化。这相当于对模型进行了“蒸馏”,让更小的模型拥有更强大的性能。 2023年9月发布的Mistral 7B(参数70亿)是小模型组的代表,可以击败参数130亿的Llama 2模型。
到了2024年,“小车型”的潮流将更加势不可挡。 Meta 的Llama 3 发布后,其80 亿模型(8B)性能变得比上一代Llama 2 700 亿参数模型更加强大,从而显着增强了文本、数学和编程能力。
原因在于Llama 3中“学习”的数据密度足够丰富。 —— 使用了15 万亿个token 的训练数据,是Google Gemini 中同等模型的两倍多。
然而,尽管如此,现实却是,如今的大型车型依然面临着“被围观”的尴尬境地。在开发人员中,模型的进步日新月异,变得更强大、更易于使用。案例越来越让人眼花缭乱,但另一方面,广大用户却为如何使用大型模型而烦恼,心中却一片迷茫。
事实上,大型模型距离人们的工作和日常生活还很遥远。数据支持了这一点:—— 根据麻省理工学院的一项研究,当今可以自动化的计算机视觉(CV) 工作占美国经济(不包括农业)工人薪酬的1.6%,但占薪资任务的23%(0.4%)。占经济总量的%)实现自动化更具成本效益。目前,人工智能只是人类工作流程的一小部分。
对于典型的C端用户来说,AI应用更多的是一种“往返”的体验。近两年流行的人工智能应用很多都拥有大量试用用户,但真正保持日活跃、周活跃的寥寥无几。实际核心受众由专业开发者和垂直领域专家(设计师、运营者、作家等)组成。
一方面是因为底层通用大模型的功能还需要不断完善,而且模型的内存容量也没有得到很好的解决。现阶段还无法准确记住用户的喜好、习惯等,更复杂的交互更是无从谈起。
因此,如今的各类AI应用都集中在文案、绘画、对话等容错的创意场景,以及基于大规模语言模型的简单游戏。
更重要的是,在——中,对话的门槛还处于较高水平,对话的深度有限,还需要研究如何编写提示(提示词)和数据训练。理解门槛高。企业用户希望大规模使用模型,并且希望超越模型选择、微调和其他任务。
简而言之,大型模型仍然难以理解并且应用成本高昂。
因此,对于辅助决策类的——家企业的核心工作流程来说,大规模的模型还没有准备好使用。例如,根据数据分析厂商九章数据的统计,在数据分析场景中使用大型模型生成SQL(结构化查询语言,数据库的核心语言)的准确率约为70%,剩下的30%仍然需要人工检查;专家认为,利用人工智能来提高效率的意义不大。
大模型和用户侧变得像一条渐近线,需要技术和场景的匹配,才能真正为用户“可用”。在刚刚结束的“AI春晚”Chigen大会上,Chigen研究院院长王忠元先生表示,“国内大型模型开始尽可能向GPT-4靠拢,这意味着基础模型是GPT-4,这意味着我们已经达到了这一点。”随着它的落地并开始赋能千行百业、进入各个垂直领域,需要寻找更好的产业生态和合作模式。 ”
许多人将大型车型的流行比作移动互联网等历史性机遇。这瞬间勾起了很多人的回忆。如今的人工智能应用层出不穷,就像移动互联网时代的应用混战。
按照历史规律,几乎每一次技术创新,从个人电脑带来的PC互联网时代到移动互联网时代,都需要两到三年以上的时间才能达到大量应用。 iPhone 1。它定义了移动互联网时代的交互形式。两年后,Uber、Whatsapp、Instagram等产品相继问世,成为风靡全球的应用。
这期间发生了什么?基础技术的变化继续将成本降低到商业上可行的水平,从而有可能带来大量的应用创新。这正在推动行业中的云计算、大数据和其他基础设施变革,而正是由于移动设备的兴起,人们花在网上的时间越来越多。
如今的AI领域也正处于从技术创新到应用崛起的关键时刻。
除了大的模式创新,应用创新也逐渐开始燎原。 2023 年,GPT-4 发布后,OpenAI 将在11 月份快速推出GPT Store,让开发者可以使用我做的简单shell 快速创建各种办公、设计和生活应用。他们活跃在教育、科研、编程等各个领域。
在最近的WWDC 大会上,苹果正式宣布与OpenAI 合作,ChatGPT 将集成到iPhone、iPad 和Mac 设备中,就像当时重新推出的App Store 一样。
根据Gartner的技术成熟度曲线,生成式AI和基础模型的大规模模型领域目前正处于扩张高峰期,未来将是应用爆发期。
资料来源:Gartner 资料来源:Gartner
然而,在此期间仍有许多工作要做。大模型技术浪潮爆发后,底层芯片、中间层基础架构等正在发生密集而快速的变革。 GPU芯片需要提高推理效率,软件中间层处理大型模型的大规模处理并降低算法层面的调用成本。
AI的难点在于大型模型本身的技术复杂性,终端设备等“平台级”基础设施与大型模型和前端应用之间的差距成为“送水人”的更大力量。将需要。 ——“按钮”等。应用开发平台现在就扮演着这样的角色,让大模型的功能能够平滑地转移到使用场景中。
例如,对于没有编程经验的用户来说,—— 开发一款操作一句话“按钮”的人工智能应用程序没有什么困难。
使用哪个模型以及如何使用它?您不需要理解困难的术语来理解模型的性能几何。 Button 的家庭机器人就像一位老师,一步步指导您如何使用模型和平台上提供的现成机器人。
在开发过程中,Button 变得像一个随时可用的工作台,为用户提供丰富的组件插件、工作流程、图像流、触发器等选择。这样,用户不再局限于开发简单的shell应用程序,而是可以通过链接的API、封装的模块等完成复杂的任务。
自去年年底推出以来,口子平台已经出现了许多有趣的用例。例如,一个汽车爱好者可能会利用“按钮”工作流程功能,添加五个节点来回答他周围很多朋友的选车问题,最终根据用户的需求选择一款汽车模型,实现搜索和比较。参数。最后输出带有照片和文字建议的购车指南。
5月15日举行的火山引擎FORCE动力大会上,五年级学生创作了一款名为“青蛙外教”的智能体,并与同学朋友Ta分享。
从某种意义上说,口子这样的AI应用开发平台最重要的意义就是将原有AI应用覆盖的开发者群体延伸到所有主流用户。当大模型本身无法解决端到端问题时,只有群策群力开发各种应用,大模型的生态才能加速发展。
此外,“模型广场”等PK形式也向市场发出了有价值的信号。对于大模型等强调“因地制宜”、擅长解决智力密集型需求的技术来说,不再需要盲目排名和参数竞争。有可能的。模型制作者和开发者需要关注每个应用场景并了解用户反馈。只有这样你才能在这个阶段真正找到你的PMF(产品市场契合度)。
如果把这两年国内大机型的火爆分成进化过程的话,上半年还担心大机型什么时候能赶上GPT-3.5,但从下半年开始就变得更加严重。 2023 年,话题突然变成了“已经:超级应用什么时候到来?”
这场争论在2024 年初达到顶峰。市场分为两种截然不同的态度。 —— 许多开发者认为,随着模型规模的增大和智能水平的提高,应用程序的功能自然也会得到发展。因此,你需要将精力和资源集中在底层的大规模模型上。 而—— 更现实。把模型做大的话成本太高,试错的成本也太大。一些投资者认为,最好的做法是“见好就收”,寻找可以快速商业化的场景。
两种姿态关注的问题都是AI应用。
近年来,大型建模界的诸多活动加速了人工智能应用的落地。 5月,大机型领域降价风暴刚刚来临,——智普、深思、豆宝、阿里巴巴、腾讯、科大讯飞等各大大机型厂商均宣布旗下机型降价。
以字节的火山引擎为例,豆宝的大矩阵在5月份就一下子降价了。目前,豆宝主力模型在企业市场的价格已跌至0.0008元/1000代币,较行业价格低99.3%。同样,用户1元可以处理3本《三国演义》的书。
定价模型接近最低价格固然是出于市场竞争的考虑,但实际上重点是扩大开发者群体,导致开发人工智能应用的试错成本过高。长期以来,太多人认真尝试构建人工智能应用程序。但车型价格下降后,开发车型的成本可能只需要几百、上千元。以前对开发人工智能应用程序的担忧不再是问题。
另一方面,AI应用供给量的增加和目标用户的扩大反馈到模型开发中。 “随着用户群的扩大,更大型号的性能也将得到改善,”火山引擎总裁谭戴表示。只有使用大量的模型,才能磨练出好的模型,并显着降低模型推理的单位成本。
类似的“好信号”还有很多。进入2024年,我们也欣喜地看到多式联运车型的进步。——无论是海外的Sora、GPT-4o,还是近期爆发的Dreamina、科灵等国内多式联运车型,用户对视频的兴趣彻底被点燃。和图像字段。 AI换脸、AI翻译、虚拟人舞等创新方式不断涌现。这是由多模态技术的进步、模型推理成本的降低以及中间层的逐步改进推动的。
相应的,现在的口子平台也跟上了AI技术的传播步伐。通过最近的更新,Kouzi 现在可以将重要内容存储为关键变量。数据库——对应于Bot插件的内存模块。从交互体验的角度来看,“按钮”还支持开场白、用户问题建议、快捷指令、背景图片、声音等设置,还支持卡片格式输出。
总之,如果用户想要开发一个能像真人一样翻译、说话的虚拟人,操作就已经很简单了,只需在按钮上选择合适的通用大模型即可。真正的人工智能助手可以非常轻松地说话和互动。此外,口子还可以将您构建的机器人直接发布到飞书、微信等平台,并无缝集成到各种生产力工具中。
随着人工智能应用门槛进一步降低,新的市场竞争有望迅速展开。这将使市场能够克服这一令人尴尬的“应用鸿沟”。 —— 只有真正将人工智能融入到每个人都能认识和使用的产品中,我们才能消除许多焦虑、矛盾或令人不安的未知。
现在,也许程序员之间的那句老话应该改为“说话很便宜,让我看看CozeBot”。
版权声明:本文转载于网络,版权归作者所有。如有侵权,请联系本站编辑删除。
拳击游戏还是有很多的玩家都是非常的喜欢尝试的,很是刺激,并且也是能够发泄心中的不快吧,现在市面上是有很多的类型的拳击的游戏,这些游戏一般都是一些格斗的游戏,其实是非常的有趣,也是相当的刺激的,游戏中是有一些不同的场景都是能够去进行体验的,我们也是能够去刺激的进行对战的,小编现在就是收集了一些有意思的拳击游戏,相信你们一定会喜欢的。
趣味烧脑游戏一般比较适合人们在无聊的时候打发时间,同时其操作以及游戏规则上都比较简单,让大家不会有上手很难的感受,可以轻轻松松就体验这个游戏的独特乐趣,并且随时下线都不用担心坑队友,同时也可以和好友一起来玩法,有多种挑战模式,可以根据自己的真实水平以及喜好来选择不同的挑战模式参与,收获到不一样的游戏趣味体验!
太空冒险类游戏顾名思义就是以外太空为背景打造的一类游戏,玩家在这种类型的游戏当中可以体验到非常独特有意思的太空冒险旅程,玩法内容的设计上充满了想象力,所有的场景都是人们在日常生活中从来没有见过的,而你可以驾驶各种各样的战舰展开无比激烈的星际对决,同时可以邀请身边的朋友一起参与到冒险当中,竞技对决的过程中十分注重
这里面为大家收集了一系列比较好玩的女生游戏,并且将会不断的更新,每个玩家都可以根据自己的喜好来选择适合自己的游戏打发时间,每款游戏都设置了新手教程,这样方便大家更加轻松的上手,不同类型的游戏可以让你领略到不一样的游戏乐趣,并且在这里随时都可以尝试其他的玩法,让你一次性就可以玩个够,同时还可以将这里的游戏乐趣分享
ai训练模型软件,ai实用小技巧
未来ai软件,未来杀手
高并发架构的设计思路,高并发怎么实现
自媒体软件有哪些?,做自媒体常用的软件
厦门旅游2个人,厦门7日游两个人需要多少钱
《地下城与勇士》十六周年新版本上线,超多新内容等你来玩!
「DNF手游」复古武器装扮居然能免费白瓢?
DNF手游可以多嫖三次罗特斯团本奖励,20号之前赶紧打完
DNF手游跨界石使用方法详解:跨界石是绑定的吗|使用后等级、附魔会变化吗
DNF手游装备继承规则详解,如何通过继承白嫖毕业词条