知识库精选- 6 月 18 日
type
status
summary
date
slug
tags
category
password
icon
- 《南瓜博士:让 AI 画了十万只猫后,我终于明白了人类的独特价值》前段时间和南瓜博士一起玩 Sref 非常上头,也聊到了对 AI 的创造与人类对比,看完这篇文章,不知道你是什么感受
- 《皮皮Peter:跨学科揭秘「OpenAI提示词工程六条策略背后的理论基础」》皮皮 Peter 的 OpenAI 提示词工程 六条 策略的解读,依据理论,包括 语言学、心理学、信息科学等多学科, 希望能帮助用户更多面的理解策略背后的理论 ,结合技巧和理论,更有效地与人工智能模型进行交互。
- 《SOP+AI:作为小白,我是如何参与制作AI动画短片的?》来自知识库共建者 JessieZTalk,她分享了 AI 动画短片制作的 SOP 流程,并根据自己的亲身体会,对想了解 AI 生成图像和生成视频的同学一些建议。作者也分享了自己参与制作的短片《奥运前夜》在广州电视台播放的喜悦。 BTW. 我们给所有投稿五篇以上的知识库作者都建立了个人专栏,帮助将各位优质文章分享给更多人,这是 Jessie 的专栏地址:锦霞 Jessie - AI 学习和应用,欢迎大家阅读。(投稿请联系@🌈Roger )
- 《斯坦福 AI 时代的人生设计课》作者小鱼猫,她分享了自己参加了斯坦福设计学院的一个很酷的研讨会,主题是"在人工智能时代设计你的生活",它提供了思维框架和工具,教大家用设计思维审视生活核心价值观。讨论包括平衡工作和个人价值、规划职业发展、选择生活价值观等。专家推荐了 ACT 心理治疗方法和 VIA 人格长处测试,帮助个人发现核心价值观。
- 《AIGC Weekly #76 》歸藏老师的第 76 期 AIGC 周刊,上一周的重要事件包括:苹果与 Open AI 合作在 ios 18 中提供 AI 服务、Luma 发布视频生成模型 Dream Machine、SD3 2B 模型开源、英伟达开源规模最大的 LLM…… 迎来一小波产品的爆发。
- 《AI 应用爆发前夜的三个信号|鹅库 2402》在歸藏上期的 AIGC 周刊里推荐过,不过还是值得再推荐一遍。松鹅所认为的三个信号是:
- 1. 下一代大模型效果的提升和成本的大幅下降
- 2. 已有玩家+AI 后的营收大幅增长
- 3. 共识的应用层创业者浮出水面
- 近期更新的 AI 研究报告一览:
- 《Celent:利用 AI 在支付领域的优势》报告讨论了生成式人工智能的潜力和银行业对此的积极探索,并预测 AI 将在提高支付处理效率和创造新的收入流方面发挥关键作用。
- 华西证券:AIGC 行业深度报告(14):《从英伟达到华为,零部件迎来大机遇》英伟达的新一代 GPU 架构将带来零部件的升级,同时,华为的昇腾 910C 芯片和 Atlas 900 SuperCluster 展示了国产算力集群的潜力。
- 《2024 端到端自动驾驶行业研究报告》通过访谈 30 余位专家,分析了端到端技术的发展、主要参与者、驱动力和挑战。预计到 2025 年,模块化端到端系统将开始商业化应用,推动技术、市场和产业格局的变革。
- 《释放英国的 AI 潜力:利用 AI 促进经济增长》来自微软,英国拥有先进的科技行业和数字优势,但与其他国家相比领先优势有限,英国面临基础设施、数字技能和数字技术采用的瓶颈。
- 《苹果 AI 揭秘:自研大模型会怎么用,和 OpenAI 是怎么合作的?》苹果发布会揭示了自研大模型能力,包括端侧小模型和云端大模型,性能强悍。自研大模型达到了 GPT4 级别,能够在苹果设备上完美运行,展示了强大的 AI 能力。与 OpenAI 的合作是为了提供更多 AI 服务选择,但实际上 Apple Intelligence 完全由苹果自研模型支持,与 OpenAI 的合作更像是与第三方大模型公司的合作。合作也注重隐私保护,用户数据不会发送到 OpenAI。
🔔Xiaohu.AI 日报「6 月 18 日」
✨✨✨✨✨✨✨✨
1⃣️
🎶Google 发布根据视频生成音频技术:V2A
- 功能:给 AI 视频自动配音、配乐
- 特点:支持“正向提示”和“负向提示”功能,正向提示引导生成所需声音,负向提示避免生成不希望出现的声音 🔗 详细介绍:https://xiaohu.ai/p/9907 🔗 https://x.com/imxiaohu/status/1802889778008142299?s=46
2⃣️
💡Google:个人健康大语言模型和智能体研究
- 功能:利用可穿戴设备数据进行健康监测
- 模型:基于Gemini开发的PH-LLM模型
- 调优:PH-LLM通过对专家分析和自我报告结果进行微调,确保建议与专家级别推荐相媲美 🔗 详细介绍:https://xiaohu.ai/p/9666 🔗 https://x.com/imxiaohu/status/1802910070558335161?s=46
3⃣️
📝Xiaoju Survey:一个开源的多功能调查问卷系统
- 功能:内置40多种题型,100多个模板 🔗 详细:https://xiaohu.ai/p/9833 🔗 https://x.com/imxiaohu/status/1802954836989907202?s=46
4⃣️
🔠提高AI图像文字渲染的准确性的模型 Glyph-ByT5
- 版本:升级到V2版本
- 功能提升:与之前专注于英文文本版本相比,Glyph-ByT5-v2能够支持10种不同语言的准确拼写,显著提升了多语言文本渲染的准确性和广泛性 🔗 详细介绍:https://xiaohu.ai/p/3718 🔗 项目地址:https://glyph-byt5-v2.github.io 🔗 https://x.com/imxiaohu/status/1802958099474796717?s=46
5⃣️
🩺Color Health 与 OpenAI 合作
- 项目:开发出 Cancer Copilot 加速癌症患者治疗
- 初步结果:使用 Copilot,临床医生平均花费5分钟分析患者记录并识别差距,而没有 Copilot 时数据分散可能导致数周的延迟 🔗 详细内容:https://xiaohu.ai/p/9935 🔗 https://x.com/imxiaohu/status/1802990017255763970?s=46
6⃣️
🔤由 Google Imagen 2 模型驱动的字母表生成器
- 功能:根据提示词创造各种字母形式,用于书写内容
- 应用:非常适合制作标题或封面艺术 🔗 传送门:https://labs.google/gentype 🔗 https://x.com/imxiaohu/status/1803000421121966316?s=46
7⃣️
🎨MimicBrush:通过模仿参考图像对目标图像选定区域自动进行局部编辑
- 功能:智能提取参考图像中的纹理(如豹纹、花纹、木纹等),并传输到目标图像中 🔗 详细介绍:https://xiaohu.ai/p/9946 🔗 https://x.com/imxiaohu/status/1803013530624639057?s=46
8⃣️
📰BBC报道:一个人使用ChatGPT取代了60名员工
- 背景:Miller领导一个由60多名作家和编辑组成的团队,为技术公司撰写和编辑文章 🔗 原文:https://www.bbc.com/future/article/20240612-the-people-making-ai-sound-more-human 🔗 https://x.com/imxiaohu/status/1803067661879754874?s=46