小互日报-1 月 4 日
type
status
summary
date
slug
tags
category
password
icon
1⃣️
🎭 Meta AI新技术 - 从音频生成虚拟人物:
- 逼真模拟多人对话中的表情和手势。
- 结合向量量化和扩散模型,提高动态性和表现力。
- 包括面部和身体运动生成,以及虚拟人物渲染。
🔗 https://t.co/J9GCkOmJ76
🔗 https://x.com/xiaohuggg/status/1742839505412137338?s=20
2⃣️
🌐 Apache Answer - 开源问答平台:
- 功能包括问答社区、内容管理和搜索。
- 支持插件拓展,多功能集成。
🔗 https://x.com/xiaohuggg/status/1742827196434268231?s=20
3⃣️
🎶 CoMoSVC - 歌声转换技术:
- 实现一步采样的高效歌声转换。
- 由香港大学和微软亚洲研究员开发。
- 平衡高质量音频转换和快速处理速度。
🔗 https://comosvc.github.io
🔗 https://x.com/xiaohuggg/status/1742779985012953468?s=20
4⃣️
👁️🤖 SeeAct - GPT-4V通用网络代理:
- 多网站执行不同任务,如产品比较、航班搜索。
- 结合视觉感知和自然语言处理。
- 功能包括动作生成、定位和多能力展示。
🔗 https://osu-nlp-group.github.io/SeeAct/
🔗 https://x.com/xiaohuggg/status/1742768663307190274?s=20
5⃣️
🖼️ AnyText - 图像中文本生成编辑:
- 阿里巴巴开发,解决文字融合和变形问题。
- 支持多语言文本生成和编辑。
🔗 https://github.com/tyxsspa/AnyText
🔗 https://x.com/xiaohuggg/status/1742749153267257699?s=20
6⃣️
👤 IP-Adapter-FaceID - 面部识别与个性化图像生成:
- 上传照片即可生成不同场景下的个性化图像。
- 利用面部ID嵌入和文本描述。
🔗 https://x.com/xiaohuggg/status/1742736491292606866?s=20
7⃣️
🌐 SEO转GEO - 生成引擎优化:
- 适应基于LLM的搜索引擎,提高内容可见性。
- 普林斯顿大学和艾伦科技研究所提出。
🔗 https://x.com/xiaohuggg/status/1742730134753550369?s=20
8⃣️
🤖 Mobile ALOHA - 人类自主学习模仿的机器人系统:
- 坦福大学开发,专注复杂移动任务。
- 软硬件全开源
🔗 https://mobile-aloha.github.io
🔗 https://x.com/xiaohuggg/status/1742719653536006621?s=20
9⃣️
🛰️ SpaceX Starlink - 直接对接蜂窝网络的卫星:
- 全球手机Starlink连接,先进调制解调器。
- 提供全球通话和网络服务。
🔗 https://x.com/xiaohuggg/status/1742710713091788984?s=20