知识库精选- 9 月 25 日
type
status
summary
date
slug
tags
category
password
icon
- 《卡梅隆加入Stability AI董事会意味着啥?》来自猫叔的文章,尽管好莱坞对 AIGC 曾持抵制态度,但卡神的加盟意味着影视行业将开始与 AIGC 合作,推动其商业化进程。这一变化可能会提升 AIGC 生成内容的质量,并改变整个影视制作生态。文章还回顾了 3DCG 技术的演变,指出未来 AIGC 与传统影视行业的结合将为创作提供更多机会。
- 《翻译:如何写作》这是李继刚推荐的一篇关于写作的文章:写作的目的是改变读者的思维方式,使其感受到价值。了解目标众至关重要,作者应写自己感兴趣的内容,真实表达自我。有效的写作需注重信号与噪音的平衡,信号是传达的信息,而噪音则是干扰因素。优秀的作品应具备强烈的信号和最低限度的噪音,从而与读者产生共鸣。最终,写作是为了满足自我表达的需求,而非单纯迎合他人。
- 《开发者新潮流 | 让做App像做饭一样平常,LLM即将开启「定制化应用开发」新时代》作者 南乔River,这篇文章探讨了「赤脚开发者」的概念,指的是那些在普通用户与专业开发者之间的群体。他们借助大模型(LLM)技术,能够快速、灵活地满足社区的小众需求。大模型的出现使得编程变得更加简单,用户只需用自然语言描述需求即可生成代码。这种新开发范式将推动定制化应用开发的新时代,降低技术门槛,使更多人参与到开发中。(全文翻译:自制软件和赤脚开发者)
- 《通向超人类未来的路线图 /《奇点更近》推荐序》《奇点更近》是雷・库兹韦尔的新作,探讨人类与 AI 融合的未来。书中描述了宇宙与人类发展的六个阶段,预言未来几十年内技术将迅速提升,改变人类生活。通过脑机接口等技术,人类将能提升认知能力、逆转衰老、实现数字永生。然而,这些技术也带来了潜在风险,如 AI 失控和基因编辑滥用。库兹韦尔的预见为我们描绘了一个激动人心但充满挑战的未来。
- 《OpenAI 发布了高级语音模式!》OpenAI 近日向更多 ChatGPT 付费用户推出了 “高级语音模式”(AVM),该模式基于 GPT-4o 技术,能实现更自然的实时对话并捕捉情感。Plus 和 Team 用户将逐步获得该功能,企业版和教育版用户下周也将上线。标准语音则适用于所有用户,提供多种语音选择。AVM 还新增了自定义指令和记忆功能,提升了用户体验。欢迎大家体验后发表自己的观点。
🔔Xiaohu.AI 日报「9 月 25 日」
✨✨✨✨✨✨✨✨
1⃣
🚀 Google 发布 Gemini 更新
- 发布了两款更新后的生产级 Gemini 模型:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。
- 相比之前版本,在数学、长文本处理和视觉理解等任务上性能显著提升。 详细:🔗 https://t.co/I8Tbt0MITu 🔗 https://x.com/imxiaohu/status/1838615429033660824
2⃣
⚡ OpenAI o1 API 发布可用性更新
- 扩展至第 4 层开发人员:每分钟可发 100 个请求(两种模型)。
- 第 5 层开发人员速率限制提升 5 倍:o1-preview 每分钟 1000 个请求,o1-mini 每分钟 5000 个请求。 🔗 https://x.com/imxiaohu/status/1838616602616717797
3⃣
🎙 ChatGPT 高级语音功能推送
- 本周开始向所有 Plus 和 Team 用户推送。
- 新增自定义指令、记忆、五种新声音和改进的口音。
- 支持 50 多种语言,中文语音更加自然流畅。 🔗 https://x.com/imxiaohu/status/1838737474623017401
4⃣
💻 HuggingFace 推出 HuggingChat 原生 macOS 客户端
- 支持在本地运行开源语言模型,确保隐私安全。
- 支持 Markdown、网页浏览、代码语法高亮等功能。
- 完全本地 AI 交互,不用担心数据外泄。 下载地址:🔗 https://t.co/0kWXAS3DH7 🔗 https://x.com/imxiaohu/status/1838760653278101816
5⃣
📸 Iris:可穿戴设备,让你拥有“无限记忆”
- 每分钟自动拍照并配上文字说明,形成时间线排列的碎片记忆。
- 挂在脖子上,记录你的生活点滴。
- 售价 99 美金,你会买吗? 🔗 https://x.com/imxiaohu/status/1838764377933254863
6⃣
🗣 多邻国推出 AI 视频通话功能
- 通过视频通话直接学习语言和练习口语。
- 可能接入了 OpenAI 的高级语音 API 功能,表明该 API 已开放给部分开发者。
- API 很快或将公开发布! 🔗 https://x.com/imxiaohu/status/1838809523966099631
7⃣
🎮 MIMO:图像与视频人物替换及交互
- 给定图像和视频/动作序列,能替换图像中的人物为视频中的人物,并控制其动作与场景互动
- 生成三维空间动作,支持丰富的运动控制及物体交互。 🔗 详细:https://xiaohu.ai/p/14024 🔗 GitHub:https://github.com/menyifang/MIMO 🔗 https://x.com/imxiaohu/status/1838828131685405125
8⃣
🧠 Google DeepMind 提出 SCoRe 自我纠正强化学习方法
- SCoRe 通过自生成数据,训练模型进行多轮自我纠正。
- 采用两阶段强化学习,使 LLMs 能自主检测并修正错误,无需外部输入或监督。 🔗 详细:https://xiaohu.ai/p/13949 🔗 https://x.com/imxiaohu/status/1838867163270336619