智能创作团队是字节跳动创作场景业务中台,负责抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。
我们的愿景:建设全球领先的创作平台和生态
我们的使命:技术创新为创造力赋能
能力板块
计算机视觉
依托大模型构建领先的 AIGC 应用算法,为业务提供有竞争力的算法解决方案。
·图片的可控生成与编辑:业务垂类基模、角色一致性、分割与局部编辑、智能排版、AI 写真、AI 风格化等。
·视频可控生成与编辑:图生视频、视频局部编辑、视频风格化、运动运镜控制等。
·多模态理解与成片:多模态基础模型、智能编排、一键长转短、智能文案等。
计算机视觉
·数字人:目标为研发多模态可控的 2D/3D 数字人生成和驱动技术,帮助用户低成本的基于数字人做视频创作、直播和对话交互,相关技术在抖音、剪映 Capcut 、商业化等业务中得到了广泛的应用。
·AR:聚焦在 3D 领域的感知、交互与生成技术,支持 AR 特效、营销等交互体验能力以及3d视频编辑功能,落地抖音、剪映 Capcut 、火山引擎等公司核心产品。
AI 工程
作为智能创作中台的 AI 工程团队,负责 AI 算法在字节跳动产品创作链路的集成落地。目前主要承担以下工作:
·大模型 AI 工程优化:数据存储管理、训练推理加速、开发流程、效果评估、多端部署等。
·算法工程化:AI 基建、平台工具、算法实现、性能优化、业务集成、生态打造、线上监控等。
多媒体&图形学
作为智创技术中台,建设关键的引擎与工具能力,通过特效协助短视频/直播/商业化/ XR /虚拟社交等业务场景完成高质量的视觉化记录和互动表达。
·多媒体特效引擎:基于多平台图形 API ,结合丰富的 AI 算法能力,抽象基础 2D/3D/动画/物理/渲染/音视频/算法组件,是跨平台的 AI-3D 互动的特效引擎。
·特效编辑器工具:基于自研跨平台应用开发框架,在桌面端/移动端提供基础的原子能力的可视化交互编辑的能力,是一套 2D/3D 特效编辑制作的解决方案。
业务成果
对内支持字节跳动多个产品线,包括抖音、剪映 Capcut、创新业务等;对外支持多个企业客户,覆盖视频创作、直播、新闻等行业。团队深耕于创作平台和生态的技术创新,逐步沉淀完整的智能创作解决方案以赋能业务,如爆款特效、智能编辑、AI 生成等:
ByteIntern 实习生招募
面向对象
2025 届毕业生(2024 年 9 月- 2025 年8月期间毕业),为符合岗位要求的同学提供转正机会
多个岗位,邀你来投
AIGC 、多模态理解、机器学习、高性能、渲染开发、引擎开发、基建效能等
5 大城市,任意选择
北京、上海、广州、深圳、杭州
扫码一键投递
我们的愿景:建设全球领先的创作平台和生态
我们的使命:技术创新为创造力赋能
能力板块
计算机视觉
依托大模型构建领先的 AIGC 应用算法,为业务提供有竞争力的算法解决方案。
·图片的可控生成与编辑:业务垂类基模、角色一致性、分割与局部编辑、智能排版、AI 写真、AI 风格化等。
·视频可控生成与编辑:图生视频、视频局部编辑、视频风格化、运动运镜控制等。
·多模态理解与成片:多模态基础模型、智能编排、一键长转短、智能文案等。
计算机视觉
·数字人:目标为研发多模态可控的 2D/3D 数字人生成和驱动技术,帮助用户低成本的基于数字人做视频创作、直播和对话交互,相关技术在抖音、剪映 Capcut 、商业化等业务中得到了广泛的应用。
·AR:聚焦在 3D 领域的感知、交互与生成技术,支持 AR 特效、营销等交互体验能力以及3d视频编辑功能,落地抖音、剪映 Capcut 、火山引擎等公司核心产品。
AI 工程
作为智能创作中台的 AI 工程团队,负责 AI 算法在字节跳动产品创作链路的集成落地。目前主要承担以下工作:
·大模型 AI 工程优化:数据存储管理、训练推理加速、开发流程、效果评估、多端部署等。
·算法工程化:AI 基建、平台工具、算法实现、性能优化、业务集成、生态打造、线上监控等。
多媒体&图形学
作为智创技术中台,建设关键的引擎与工具能力,通过特效协助短视频/直播/商业化/ XR /虚拟社交等业务场景完成高质量的视觉化记录和互动表达。
·多媒体特效引擎:基于多平台图形 API ,结合丰富的 AI 算法能力,抽象基础 2D/3D/动画/物理/渲染/音视频/算法组件,是跨平台的 AI-3D 互动的特效引擎。
·特效编辑器工具:基于自研跨平台应用开发框架,在桌面端/移动端提供基础的原子能力的可视化交互编辑的能力,是一套 2D/3D 特效编辑制作的解决方案。
业务成果
对内支持字节跳动多个产品线,包括抖音、剪映 Capcut、创新业务等;对外支持多个企业客户,覆盖视频创作、直播、新闻等行业。团队深耕于创作平台和生态的技术创新,逐步沉淀完整的智能创作解决方案以赋能业务,如爆款特效、智能编辑、AI 生成等:
ByteIntern 实习生招募
面向对象
2025 届毕业生(2024 年 9 月- 2025 年8月期间毕业),为符合岗位要求的同学提供转正机会
多个岗位,邀你来投
AIGC 、多模态理解、机器学习、高性能、渲染开发、引擎开发、基建效能等
5 大城市,任意选择
北京、上海、广州、深圳、杭州
扫码一键投递
相关职位: