电话

020-88888888

必一运动·(B-Sports) - 优才面对面 北大深圳研究生院袁粒:推动技术普

标签: 2024-07-02 

  在这个充满活力和创新的城市——深圳,我们见证了一个又一个“高精尖缺”人才的涌现,他们或投身于科技创新的前沿,或在文化艺术的殿堂里熠熠生辉,亦或在各行各业默默耕耘,为社会的发展贡献着自己的力量。这些人才不仅是深圳这座城市发展的中坚力量,更是我们时代进步的见证者和推动者。

  为了更好地挖掘和展现深圳人才故事,市“鹏城优才一站式”服务平台(深圳市人事人才公共服务中心主办)特别推出了《优才面对面》栏目。本栏目旨在通过深入访谈和报道,展现深圳人才的成长历程、心路历程和奋斗故事,让更多人了解他们的奋斗精神和创新精神。

  本期优才面对面,邀请到“鹏城优才卡”持卡人,北大深圳研究生院助理教授袁粒,讲述他的优才故事。

  “‘开源版Sora’登场,并对所有人开放。”数月前的憧憬,如今正逐步变为现实……今年3月,北京大学博士生导师、北大深圳研究生院助理教授袁粒及其团队发起Sora复现计划——“Open-Sora”。

  袁粒透露,当前,Open-Sora Plan已初步实现视频生成功能,并向公众全面开放,无需商业授权即可使用。他表示,希望通过共享模型源码与数据,激发全球用户的创新潜能,推动大模型的普及与应用。

  为何是“复现”而非“超越”?“我们与国外的大模型仍存在一定差距,‘超越’尚言之过早。”袁粒坦言,作为高校团队,在算力和数据资源有限的情况下,能够复现出一版“tiny Sora”已属不易。他强调,Open-Sora Plan的初衷在于推动技术的普及和应用,让所有人都可以无条件地使用开源的数据和模型。

  袁粒详细介绍了Open-Sora Plan的框架构成,包括视频编、Diffusion Transformer以及条件注入三个部分。他表示,这一框架在推出后得到了开源社区的大力支持。

  在技术细节上,袁粒特别提到了Video VAE模块在视频压缩和重建方面的重要作用。他表示,团队通过大量工作实现了对视频的高效压缩和高质量重建,使得在有限算力下能够处理更长的视频片段。此外,团队还通过“爬取视频数据”和“利用文本驱动物理引擎合成数据”两类数据收集方案,来提升文本与视频的对齐度和细粒度。

  启动近三个月,Open-Sora Plan进展如何?袁粒透露,团队已于今年5月成功发布第一版预训练模型。尽管当前模型与Sora存在一定差距,但已完成第一阶段目标,即1.0版本的发布。这一版本现已公开,无需商业授权即可使用。

  目前,该计划正稳步推进至第二阶段,其目标在于训练出能够生成20秒以上、720P清晰度视频的模型,这也是开源项目的终极目标。

  “在这一阶段,开源社区给予了团队巨大支持。例如,项目联合发起方兔展智能提供了百卡H100和H800的算力资源,以助力第二阶段研发;华为昇腾团队也积极合作,提供了数百卡的国产算力支持。”袁粒强调,第二阶段成果仍将保持开源。

  此外,Open-Sora Plan的第三阶段将致力于超越开源项目的现有目标,通过引入更多算力和数据资源,使模型在泛化性和时长上更接近Sora。

  除了备受关注的Open-Sora Plan,此前频频登上热搜的ChatExcel和ChatLaw等垂直领域产品,均出自袁粒团队。

  2022年下半年启动研发,2023年2月正式发布,ChatExcel的诞生源于许多人日常工作中不断重复的Excel操作场景。据袁粒介绍,用户只需向ChatExcel表达表格需求,ChatExcel便能实时更新并高效完成任务。2023年7月,法律大模型ChatLaw问世。作为国内首个法律场景下的落地大语言模型产品,ChatLaw旨在成为律师的得力助手,通过替换一些底层重复性工作,辅助专业律师大幅减轻工作负担。

  自2022年初加入北京大学深圳研究生院,袁粒在学术研究和应用创新领域均取得了显著成果。外界或许更多地聚焦于其团队开发的ChatExcel、ChatLAW等应用产品,以及当前的Open-Sora Plan,但袁粒强调,其团队在学术领域的探索同样不遗余力。

  据介绍,袁粒的研究方向为深度视觉神经网络设计和多模态机器学习。当前,他已在人工智能期刊和会议上发表40余篇学术论文,其中代表性的第一作者论文包括VOLO视觉模型(IEEE TPAMI)和T2T-ViT论文等,后者曾单篇被引用千余次。值得一提的是,袁粒在2023年入选国家级高层次青年人才计划。

  “兴趣是万丈大厦的奠基石。”袁粒多次强调兴趣在个人成就中的关键作用。他庆幸自己在高中时,尽管对技术知之甚少,却在直博的时候机缘巧合地选择了电子计算机专业,并在随后的学术生涯中不断深化和拓展这一兴趣。他坚信,将个人兴趣与工作紧密结合,能够最大限度地激发个人的主观能动性,并成为长期坚持不懈的动力源泉。

  为何选择北京大学深圳研究生院?“北大加深圳这一组合,不仅代表国内顶尖学府的学术底蕴积淀,更融合了深圳这座创新之都的自由氛围和开放精神。”他透露,博士毕业后,他收到了来自全球多所名校的教职邀请,经过深思熟虑,最终选择了北京大学深圳研究生院。这一选择不仅基于学术考量,更因为他对深圳这座城市的热爱。

  谈及深圳的科研环境,袁粒给予了高度肯定。他表示,深圳对科研人员的支持力度显著,尤其是对年轻科研人员而言,这种支持更是弥足珍贵。他感慨道:“自从加入北大深圳研究生院以来,我可以自主决定招收的学生、研究方向以及工作内容,这种‘自由’让我能够充分发挥个人的主观能动性。”

  袁粒还提到,深圳这座城市鼓励年轻人承担重要任务,支持他们独立开展研究工作。“这种对年轻人的信任和支持,以及对个体的尊重,正是深圳这座城市特有的魅力。”必一运动·(B-Sports)