翻页   夜间
黄易小说 > 科研系学霸 > 第76章 实则不然

    天才一秒记住本站地址:[黄易小说] http://www.huangyixiaoshuo.info/最快更新!无广告!

    要说现场能勉强跟得上周昀思路的,除了早就看过论文的邓永华和林院长,那就只有车伟强和那位浙大的答辩老师了,

    至于其他三位老师,也听不明白的,但是却他们不得不硬着头皮去听,因为他们是答辩老师,等会儿可能需要提问题,

    这就让他们有点汗流浃背了,他们也担心等会儿自己提的问题会不会闹出笑话,更别说林院长还坐在后面旁听。

    当PPT放到最后一页的时候,周昀朝台下微微鞠了一躬。

    “以上就是我的主要研究内容,请各位老师批评指正。”

    顿时,整个会议室陷入了一种诡异的寂静,有点大学课堂上老师请学生站起来回答问题,然后大家都默不作声的感觉。

    台下第一排,三位没听懂的老师都很有默契的互相对视了一眼,露出了尴尬的微笑。

    终于,那位浙大老师打破了沉默,让另外三位答辩老师如释重负:“周昀同学,你的毕业论文非常优秀,

    我对你的分成最优传输框架很感兴趣,你提到使用Gromov-Wasserstein距离来处理模态间的几何不一致,

    但能否更深入地解释一下在非欧几里得度量空间中,为什么又要通过Fused Gromov-Wasserstein变体来平衡内容和结构对齐?

    此外,在高维嵌入中,你如何通过谱正则化来确保求解的数值稳定性?”

    此时的周昀已经完全地进入了状态,他点了点头:“非常好的问题,GW距离确实擅长捕捉跨域结构相似性,

    但对于多模态语义对齐,我们需要同时考虑特征内容和关系结构,因此我采用了FGW,它结合了经典OT的内容传输和GW的结构匹配。”

    他说着走到讲台旁边,拉过一旁的白板,拿起笔开始边写边讲:“FGW的定义为:FGW_α(μ,ν, C_X, C_Y, D)=(1-α) OT(μ,ν, D)+α GW(μ,ν, C_X, C_Y),

    其中α∈[0,1]是融合参数,D是内容成本矩阵(如||x-y||^p),C_X和C_Y是各自模态的内部相似矩阵,

    在非欧几里得空间中,比如视觉嵌入的球面流形或语言的超双曲空间,我将度量泛化为Riemannian度量

    ......

    不知道这是否能解决您的第一个问题?”

    浙大老师点点头:“可以了。”

    周昀点点头,将白板上的内容擦去:“好,那接下来我回答您的第二个问题。”

    马克笔不断在白板上写下各种奇怪的符号,至少在一些旁听的老师和学生眼里是这样的。

    “对于高维嵌入的数值稳定性,维度灾难会导致C_X和C_Y的谱不稳定,我引入了谱正则化:对相似矩阵施加核范数罚项,min ||C||*+λ||C - K||F^2

    ......

    这样就能这确保了在噪声环境下,FGW的梯度下降不会发散,实验中在ImageNet-1K上的鲁棒性提升了15%。”

    浙大老师并没有第一时间回答,而是重新翻到了论文的对应页面,看了一会儿才朝着周昀点了点头,眼里满是对周昀的欣赏:“我没问题了。”

    此时,车伟强也放下了手里的笔,朝周昀笑了笑:“周昀同学,你的论文写得非常扎实,理论深度就算是我都有些自愧不如,

    不过你能否解释一下关于你在多模态融合中提到的Schrödinger桥框架,在高维嵌入中,你如何处理SB路径优化的非凸性问题以保证收敛?”

    旁听学生中有车伟强的学生,当他们看到老师脸上的笑容时,心中浮现出三个字——科幻片!

    入学一两年以来,他们从来没见过车伟强在他们面前笑过。

    果然,人和人之间的差距有时候比人和狗都大。

    “没问题。”周昀微微点头,拿笔开始在白板写下公式:“Schrödinger桥(SB)通过最小化相对熵求解从视觉模态μ到语言模态ν的最优随机路径:

    SB(μ,ν)= inf_{P: P_0=μ, P_1=ν} KL(P || Q),其中Q是布朗运动参考路径,

    为了融入时间序列对齐,我将动态时间规整(DTW)引入SB框架,构建时间依赖的传输计划。

    ......

    推导上,SB的密度满足Fokker-Planck方程:∂p_t/∂t =-(1/2)Δp_t - div(p_t v_t),其中v_t是最优速度场......”

    车伟强听后,点了点头:“所以,你是用DTW给SB加了个时间对齐的先验,相当于在路径上加了个正则项,强制X和Y同步?就像是用动态规划把时间轴拉直。”

    周昀笑着摇了摇头:“实则不然,刚刚我在PPT里也有讲到,我的做法是将DTW成本嵌入Girsanov变换,优化联合分布P_t和γ,使得路径既满足时间对齐又保留SB的扩散特性,

    数学上,软DTW的梯度∂DTW/∂γ通过Sinkhorn-like迭代计算:

    A_γ^{(k+1)}= softmax(-c(X,Y)/δ+ log A_γ^{(k)})

    ......”

    说着他又在白板上写下一行公式。

    车伟强愣了愣,哑然一笑:“哈哈,倒是我想简单了,那我也没问题了。”

    这一幕看的前面答辩完的学生一愣一愣的。

    不是说好了只答不辩吗?

    而且这个叫周昀的又是什么情况?这还是研究生吗?博士生都没这么夸张吧?

    看着写满了数学公式的白板,几位研三的学生感觉自己好像在听天书。

    学生如此,老师其实也没好到哪里去,特别是前排的答辩老师。

    靠左边的答辩老师偷偷抹了下额角并不存在的汗,心中也是大为震撼:“现在的研究生都已经到这种程度了?”

    还好有另外两位老师提了问题,他也不用硬着头皮提问了,这倒是让他松了一口气。

    坐在邓永华旁边的林院长对周昀地表现也是非常满意。

    不过这时候,压力全部来到了今天上午最后一个答辩的学生身上。

    周昀之前的学生都已经答辩过了,就算周昀的表现再优秀,也很难影响到他们,但是最后一位学生就不一样了。

    对比不可怕,但是谁菜谁尴尬。

    很明显,最后一位学生相较于周昀来说就是比较菜的那一个。

    但老师已经点到了他的名字,他不得不硬着头皮走上讲台。

    结果也是不出意料,有着周昀这块珠玉在前,几位老师的兴趣也被提了起来,看论文也就更加细致了一些。

    问的问题也刁钻了许多,哪怕是这位学生觉得自己已经准备得还可以了,也被问地汗流浃背。
章节错误,点此报送(免注册), 报送后维护人员会在两分钟内校正章节内容,请耐心等待。