小互日报-2 月 15 日
type
status
summary
date
slug
tags
category
password
icon
1⃣️
🎨 ConsiStory:无需额外训练的连续一致图像生成工具。
- 根据多个文本提示生成一致主题与布局多样的图像系列。
- 类似于一键生成一组风格一致的漫画不同场景。
- 项目及演示:https://consistory-paper.github.io
- 论文:https://arxiv.org/abs/2402.03286
🔗 https://x.com/xiaohuggg/status/1758131675094274089?s=20
2⃣️
🤖 Vicarious:创新的腹部手术机器人。
- 通过1.5厘米小切口完成手术,减少伤害和恢复时间。
- 28个传感器装备的机器人手臂模仿医生上半身动作,提供360度3D视野。
- 官网:http://vicarioussurgical.com
🔗 https://x.com/xiaohuggg/status/1758062271409053935?s=20
3⃣️
📜 美国专利商标局(USPTO):AI不能作为专利发明者。
- 明确只有真人可申请专利,强调人类创造性和智慧的重要性。
- 提供AI在发明过程中的角色示例,明确什么情况下的发明可获专利资格。
🔗 https://edition.cnn.com/2024/02/14/tech/billions-in-ai-patents-get-new-regulations/index.html
🔗 https://x.com/xiaohuggg/status/1758056275219567020?s=20
4⃣️
🔍 Lumos:端到端多模态问答系统。
- 利用STR技术从复杂场景图像中准确提取文本。
- 整合图像理解与语言处理,准确回答基于图像的查询。
- 论文:https://arxiv.org/abs/2402.08017
🔗 https://x.com/xiaohuggg/status/1758028721486021055?s=20
5⃣️
🧬 GeneGPT:NCBI开发的生物医学专业知识处理工具。
- 改进大语言模型对生物医学知识的处理能力。
- 支持基因组DNA比对、蛋白编码基因识别等任务。
- 论文:https://arxiv.org/abs/2304.09667
- GitHub:https://github.com/ncbi/GeneGPT
🔗 https://x.com/xiaohuggg/status/1758012243529330923?s=20
6⃣️
👩🔬 FaceFusion 2.3.0:高精度面部识别技术更新。
- 68点面部标记模型提升口型同步效果。
- 优化算法处理面部边缘,增强稳定性和准确性。
- 68点转5点简化模型,提高面部识别效率。
- GitHub:https://github.com/facefusion/facefusion
🔗 https://x.com/xiaohuggg/status/1757998515308106186?s=20
7⃣️
🗣️ WhisperKit v0.2:让Whisper运行在Apple Watch。
- 更高效,资源占用更少,优化语音识别处理。
- GitHub:https://github.com/argmaxinc/WhisperKit
- 模型:https://huggingface.co/argmaxinc/whisperkit-coreml
🔗 https://x.com/xiaohuggg/status/1757955251293082061?s=20