直达「 通往AGI之路 」飞书知识库 →
通往AGI之路·近日导航7-16
🗒️通往AGI之路·近日导航7-16
type
status
summary
date
slug
tags
category
password
icon
我觉得中国古代文学有一些最美的对人类历史的深刻思考,MidJourney这个名字其实来自我最喜欢的一个道家书籍的翻译,来自于庄子。我之所以喜欢这个词,是因为我觉得人有时很容易忘记过去,容易有失落感,对未来感到迷茫和不确定,但最重要的是我们就生活在旅途中,我们来自于丰富和美丽的过去,在我们面前是疯狂和难以想象的、宝贵的未来。——David Holz
 
近日导航这个栏目是期望减少阅读 AI 新闻的焦虑,通过知识库的梳理与总结,帮你获取最重要的几条新闻。

AI 虚拟数字人

在开放了知识库共建者计划之后,已经有10+位热忱的伙伴加入进来,有些伙伴在大厂做大模型研发,有些伙伴擅长AI绘画、曾加入过上百个绘画群,有些伙伴在海外留学刚好暑假有时间参与共建。有了大家的参与之后,我们可以对知识库做更加完备的整理和输出。
 
比如AI虚拟数字人这个板块,之前的内容还是比较粗浅,舟航作为共建者领取了对这个板块的梳理,他一直以来对虚拟数字人有长期观察,并记录在自己的Notion上,在他的梳理下,整个数字人的板块有了质的提升,你可以通过 《通往AGI之路》— 1.4入门:AI语音与数字人 — AI虚拟数字人简介 这个目录下看到新增的近10篇内容。
notion image
 
其中,不仅有推荐阅读的内容、论文,还有数字人所涉及的核心技术、市场竞争、典型案例及一些思考等,能帮你快速了解虚拟数字人这个领域,当然相关领域也还在快速发展和变化中,我们也会及时更新更多新进展。
notion image

关于Agents的讨论

极客公园最近与潘乱、心识宇宙创始人陶芳波和聆心智能CEO张逸嘉的访谈很值得一听,收录在AI Agents目录的文章精选中。
notion image
 
OpenAI这个全世界最牛的大模型公司已经意识到大模型本身并不能解决所有问题,在上面要发展出一种新的形态,才能达到我们对于大模型这种技术变革的一个期望。于是AI Agents成为了特别关注的领域,它在基于大模型的常识能力、推理能力,能够创造出一种更加接近于人类的服务的方式。
 
它在三个能力方面不断演进,包括:自主思考和分析(比如AutoGPT)、创造工具(比如Voyager)、协助能力(比如Fixie.AI),甚至两位创业者判断AI Agents的市场比大模型还要大很多倍。而且AI Agents 该是一种新的范式,一种全新的形态,在这种形态下,你与它的自然交互是主体,但它肯定会提供很多额外的功能。
 
另外,我还看到了一张e2b.dev制作的AI agents生态全景图,展示了海外的一些公司动态和分布。
notion image

一图胜千言

上面那张图收录在《通往AGI之路》- 0.从这里启程 - 一图胜千言|AI好图分享 目录下,这里的更新频率比较高,你可以找到一些有趣的图片和来源。
notion image
 
本周比较有趣的收录来自@FinanceYF5发布的AI相关网站统计量统计,通过TOP 90的网站访问量,你可以看到很多AI网站的流量变化趋势:
notion image
 

大语言模型带来的交互方式变革

本期最后一篇推荐来自张俊林在2023 WAIC 开发者论坛上发表的演讲《自然语言交互:大语言模型带来的交互方式变革》,其核心观点是无论是人机交互还是 AI 之间的交互,都采用自然语言的方式,由此人操作数据的方式将变得更加简单与统一。而大语言模型处于人机交互的中心位置,复杂的中间过程将会隐藏到幕后,由语言模型通过 Planning+Programming 的方式解决。
notion image
摘要他的几个有意思观点:
  • 现在大家普遍看好多模态方向,但我个人对多模态大模型的发展没有大多数人那么乐观。原因很简单:虽然现在很多同时处理文本和图像的模型效果还可以,但究其原因,并不是图像或视频技术获得了突破,而是文本模型能力太强,是它带着图像模型在飞。也就是说,从技术能力上讲,文本和图像模型并不对等,而是文强图弱,以文补图。实际上现在图像和视频方面还有严重的技术障碍没有突破。在图像处理上方盘旋着一朵 “技术乌云”,如果无法突破,多模态就面临着阴影和极大障碍,在应用方面很难取得重大进展。
  • 有人说 prompt 就像是念咒语,我认为这更像是给大模型做 PUA。我们可以把大模型比作能扮演各种不同类型角色的人,为了让它做好当前的任务,我们需要把它调整为最适合做这个任务的角色。为此,我们需要写 prompt 把这个角色诱导出来:「你是很博学的,你特别适合干这个事儿,你应该干的更专业点,不要太随意。」。诸如此类。
  • 如果归纳下 Agent 之间的协作方式,主要有两种:竞争型和协作型。竞争型就是不同 Agent 之间互相质疑、争吵、讨论,以此可以得到更好的任务结果。协作型就是通过角色和能力分工,各自承担任务环节中的一个,通过互相帮助和协作来共同完成任务。

结语

这一期的引言来自于大卫·霍尔茨的一句话,其实我最初读到它的时候来自新闻:讲到了MidJourney来自于庄子的「中道」一词。开始读到新闻的时候,感触不是很深刻,但在收集他的 原始演讲想做成金句引用的时候,发现大卫·霍尔茨的原始视频讲得真好,虽然段落很长,但我不舍得删掉一个字。
 
我们每个人都是在旅途当中,我们都曾有过丰富和美丽的过去,我们不该遗忘它,怀着这样的美好去创造更加难以想象、宝贵的未来吧!
notion image
 
notion image
 
 
 
 
从这里启程的基石阅读知识库精选- 2025 年 3 月 21 日
Loading...