直达「 通往AGI之路 」飞书知识库 →
小互日报-1 月 3 日
小互日报-1 月 3 日
资讯|2024-1-3|最后更新: 2024-1-25
type
status
summary
date
slug
tags
category
password
icon
🔔 Xiaohu.AI日报「1月3日」
✨✨✨✨✨✨✨✨
1⃣️ 🤖 微软研究团队的新进展: - 微软利用合成数据训练AI,减少成本和偏见。 - 生成了100种语言的文本数据,提高AI训练效率。 - 论文链接:https://arxiv.org/abs/2401.00368 🔗 https://x.com/xiaohuggg/status/1742473942252855795?s=20
notion image
 
2⃣️ 📔 Pile:AI日记软件介绍: - 开源界面美观,助力日记撰写和记录。 - 集成OpenAI API,扩展思想和日记。 - AI搜索和问题解答功能,保证安全隐私。 - 下载链接:https://udara.io/pile/ - 项目源码:https://github.com/UdaraJay/Pile 🔗 https://x.com/xiaohuggg/status/1742427654006202439?s=20
3⃣️ 👀 VCoder:视觉编码器增强模型: - 增强LLM的视觉理解和分析能力。 - 处理分割图和深度图,改善对象感知。 - 在对象识别任务中表现优于GPT-4V。 - 项目链接:https://praeclarumjj3.github.io/vcoder/ - 代码库:https://github.com/SHI-Labs/VCoder 🔗 https://x.com/xiaohuggg/status/1742410353198416282?s=20
notion image
 
4⃣️ 🎵 M2UGen:多模态音乐理解生成模型: - 理解音乐风格、乐器、情感,进行音乐问答。 - 根据文本、图像、视频生成音乐。 - 编辑音乐仅需文字描述。 - 该模型由腾讯与新加坡国立大学开发 🔗 https://x.com/xiaohuggg/status/1742392202482061509?s=20
notion image
 
5⃣️ 🗣️ DreamTalk:人物头像动画生成开源了 - 使人物照片头像根据音频说话或唱歌。 - 保持嘴型和表情一致。 - 代码库:https://github.com/ali-vilab/dreamtalk 🔗 https://x.com/xiaohuggg/status/1742382786990969226?s=20
notion image
 
6⃣️ 💠 SVG-Loaders:纯SVG格式加载图标和动画: - 免费下载,适用于网页和应用。 - 高质量、多样设计,易于使用和自定义。 🔗https://x.com/xiaohuggg/status/1742377903818711044?s=20
7️⃣
🐭 Mickey-1928:专注米老鼠图像生成模型:
  • 基于Stable-Diffusion-xl微调,生成1928年风格米老鼠图像。
  • 训练数据包括三部卡通的静止画面。
notion image
 
小互日报-1 月 4 日小互日报-1 月 2 日