直达「 通往AGI之路 」飞书知识库 →
小互日报-2 月 2 日
小互日报-2 月 2 日
资讯|2024-2-2|最后更新: 2024-2-3
type
status
summary
date
slug
tags
category
password
icon
1⃣️
🌍 Google Bard全球更新:
  • 支持Gemini Pro,覆盖40种语言、230多个国家和地区。
  • 新增图像生成功能,基于Imagen 2模型,目前仅支持英语。
  • 多语言双重检查功能,通过“G”图标验证Bard回答的准确性。
  • 图像生成中加入可识别水印(SynthID)。
🔗 https://blog.google/products/bard/google-bard-gemini-pro-image-generation/
notion image
 
2⃣️
📷 JoyTag开源图像标注模型:
  • 输出5000多个标签预测,无内容过滤,支持性正面内容。
  • 基于ViT-B/16构建,输入尺寸448x448x3,9100万参数,训练样本660M。
  • 适合多样化图像内容,特别优化Diffusion模型训练。
notion image
 
3⃣️
🎥 Wonder Studio摄像机追踪与点云技术:
  • 自动识别摄像机移动和拍摄场景,精确CGI与实景融合。
  • 包括摄像机追踪和点云技术,支持3D场景重建和CG元素自然移动。
🔗 https://x.com/xiaohuggg/status/1753386192224362950?s=20
 
4⃣️
🖼️ Google ImageFX工具:
  • 基于Imagen 2,通过点击关键词合成提示词生成图片。
  • 类似Google MusicFX操作体验。
 
 
5⃣️
🔧 InstructIR图像恢复工具:
  • 根据文字描述改善图片,支持去噪、去雨、去模糊等。
  • 使用NAFNet和指令条件块(ICB),支持多任务学习。
 
6⃣️
📝 InternLM-XComposer图文创作模型:
  • 自由形式输入下的图文创作和理解,包含海量图文知识库。
  • 支持图像识别、感知和视觉推理。
 
 
7⃣️
🎨 Poe Image Remix功能:
  • 修改AI生成图片的风格、布局和颜色。
  • 支持SDXL和Playground v2图像生成机器人,适用于Web、macOS、Windows,计划扩展到iOS和Android。
🔗 https://x.com/xiaohuggg/status/1753257680804946390?s=20
notion image
小互日报-2 月 3 日小互日报-2 月 1 日