第145章 草台班子的第一次会议
“大家好,我叫陈耀宗,目前工作主要是研究概率论。骆教授跟我提了乔源博士的这个想法后,我就开始思考能否將概率图模型,比如高斯过程应用到这个问题上。但思考过后从理论上来说,这是个很蠢的办法。首先我们需要建立一个带有优质跟劣质標籤的大规模论文数据集,然后將之转化为监督分类问题。
显然光是建立这么一个论文数据集就是个极大的工程。而且要辨別论文是优质还是劣质,或者水论文本身需要一个標准………”
.…从优化的角度看,我们的目標是要为一个高度非凸且可能存在平坦区域的损失曲面,找到一个能通向全局最优的路径。
在我看来,一篇高质量的论文,其证明路径在抽象的逻辑空间中所形成的几何轨跡应该是迂迴的,但最终能收敛……”
“……我认为可以尝试將一篇论文的论证过程建模为一个离散动力系统。其稳定性和收敛性可以类比为论证的严谨和有效………”
.……基於以上论证,所以我的想法是,我们也许可以从更基础的特徵工程开始做起。
传统ai做文本分类,特徵无非是词袋、tf-idf、主题模型如lda。我们可以尝试构建一个多模態模型,同时处理文本、公式和图表……”
.……直接从知识图谱的补全角度切入。具体来说,训练一个模型,当输入一篇新论文p时,它能判断出p是否填补了图谱中一个关键的空洞。
我们可以借鑑图神经网络,比如graphsage或gat,来预测这篇论文在目前知识网络中的重要程度……“我觉得刚刚各位老师都说得很好,我是学数据挖掘的,之所以希望加入这个课题,主要还是希望能提升自我。
如果一定要说想法,我觉得就是可以利用无监督学习,对大量论文的嵌入向量做一个聚类。我觉得学术审美的差异或许会映射在不同聚类中心之间的距离和形状上。
这样就可以计算一个轮廓係数的变种,並依此来衡量一篇论文相对於已有知识的位置。
这其中有些是我之前的想法,有些是我刚听鲁教授的发言想到的。
不管如何我的主要目的还是学习和提高,会尽力完成布置给我的任……”
乔源坐在骆余馨旁边,默默听著这个临时组建的兴趣小组成员们的发言。
然后发现他似乎小看了燕北大学的底蕴。
虽然说人都是骆余馨一天找到的,但从发言上看,这些人都是有想法的。
甚至已经从各自的研究层面论证了他这个想法的可行性。
他本以为如此仓促组成的小组肯定是个草台班子。
但现在他不这么看了。
只能说燕北大学的底蕴有些可怕。隨便拉几个人都是能人。
有想法,有见地,有经验,甚至还很有执行力………
当然这也是乔源的错觉了。
虽然燕北大学的確很强,但还没强到这种程度,更关键的原因还在於现在还是寒假。
而且跟骆余馨拉的人,大都是她比较了解的那一批。本身就把一批打算混文凭的淘汰了。
此时所有人都已经將目光集中到了他身上。
毕竟大家都发过言了,只剩乔源了。
“嗯,首先感谢大家刚刚提出的宝贵意见。接下来我简单谈谈我的想法。
其实我想要做这个项目也不是一拍脑子的决定,而是在帮助有为集团解决雅典娜的凝视这一问题后进发出的想法。”
乔源说到这里下意识的顿了顿。
因为他发现当提到雅典娜的凝视时,好几个人的表情突然变得有些古怪。
甚至有人明显是在憋笑……
乔源感觉有些奇怪,不过这种场合他还是压下了情绪,继续开口说道。
“刚刚几位老师从动力系统、概率图模型以及图神经网络等等角度给出了不同的技术路径。都很有建设性,但也反应出了传统ai技术跟我们所希望实现目標的根本性矛盾。
也就是我们希望用ai去定义优质,但所有建议用於训练ai的数据跟標籤依然是產生这一问题的评价体系。
就比如陈博士刚才提到了高斯过程。我知道这个想法很好,能给出不確定性,但其核心无非就是先验的协方差函数。
如果预设的协方差结构本身是平庸的,那么得到的结果在最乐观的情况下,也就是一个更精確的平庸度量仪。
事实上这一类的智能產品已经有了。谷歌、微软都有类似的智能体,而且还被广泛应用。我之前英语不过关的时候也用过。
但我所想实现的学术审美並不是简单的归纳、总结,而是希望ai本身具备一定和判断能力。正如刚才我所说的那样,我的想法来源於帮助有为集团解决的优化算法问题。
现在请大家思考一下。难道你们不觉得雅典娜张量伺服器的算法问题和我们想要解决的问题很像吗?我说得更明確些,其张量伺服器配套的联合算法所需要优化的性能本身就是极为复杂、多维且难以用简单指標衡量的。
这迫使算法不能仅仅追求一个预设的、可能很平庸的高分,而必须学会在探索中动態地理解什么是真正的优质。
所以我在解决其数学基础问题的同时,也开始考虑,为什么我们构建一个类似,可以动態演进的学术审美函数呢?
我预想中的智能体和诸如谷歌、微软提供的智能体不一样。它关注的不是文献中有什么,公式也好,数据也好,都不重要。
它需要去理解这篇文献做了什么,包括论证的逻辑流,提出的假设是否有足够的理论支撑,以及结论对整个体系的贡献。
所以我想要的不是一个总结性工具,而是在理解当下数学体系发展进程的前提下,能对於文献做一个综合判断的智能体!
这从底层逻辑上就跟大家的构想不太一致。而且这段时间我也查了一下,目前还没有人工智慧能够做到这一点。
所以理论上来说,我们需要从头开始设计。之前的方案没有什么太多可供我们借鑑的。
不过有一点,要让这一智能体能理解当下的数学进程,首先需要餵给它足够多的文献数据。所以我就直接说接下来的工作安排了。首先我们要为当下主流的数学研究方向做分类,並以此为依据构建一个目录……”
如果说刚开口时,乔源还会关注一下其他人的表情,介绍完他的想法,到了布置工作环节,他已经很自然地全情投入了进去。
而且这件事他觉得是很有必要做的。甚至不止是为了他能找论文更方便。
虽然那天他专门跟骆余馨说了想法,这个人工智慧並不能取代审稿人的地位。
但乔源却希望这项技术未来能真的有用,起码正確率能达到一定標准,这样才可能获得学术界的认可。最终目的则是让这项技术能够在未来成为一个课题的准入或者结算標准。甚至成为一个学术体系的评价標准。
简单来说就是未来不管是评职称、评项目,之前发表的论文都必须通过这款人工智慧的检测。只有论文的评级达到及格线以上,才有机会继续往上走。
最好国外能一样。
不管是学校內成为教授,还是跟评奖,又或者跟科技企业合作,都能用得上。
好处是能净化学术领域水论文的情况。也儘可能的让自家导师曾经经歷过的尷尬情况不再出现。当然这个宏大的想法他暂时是不会跟这些人说的,其中也包括了骆余馨。
因为想要达成他的最终目標难度太大。甚至不只是技术方面的难度。
但如果暂时只用在个人学术助手的领域,帮助研究者筛选出有用的论文,更容易被接受,也简单的多。毕竟小范围个人使用,並不需要太高的准確度。而且整套评价体系也不用被大眾审视。
用乔国庆的话说就是,饭要一口口的吃,贪多嚼不烂。
在有一个宏大目標之前,一定要先分成一个个小步骤,慢慢来。
这样每达成一个小目標,都是一次成功。更大的好处是,当走到某个阶段发现走不通了,也好隨时放弃,及时止损。
很快乔源就把自己的想法,告知了所有人。
具体的框架肯定还是需要他来著手解决,因为关於非光滑的噪声引入技术,本身就还在研究中,更没有推广。
但还有很多细节性的东西自然就是交给团队其他人了。
这本就是组建团队的目的,如果所有事情都由他自己来做,累死都做不完。
就这样,乔源发言完毕之后,会议也到了尾声。
就在骆余馨打算宣布今天的会议结束时,鲁承泽突然开口补充了一句。
“对了,如果大家遇到需要特定未收录资料库文献的时候,不要直接购买,可以先问问乔源博士能不能找到。
他有访问隔壁华清数学科学院文献资料库的最高权限。有些我们这边可能缺失的文献,也许那边会有。鲁承泽话音落下,乔源明显感觉到会议室这帮人看他的目光又变得不一样了。
甚至包括了坐在他旁边的骆余馨。
半晌后,这个女人才用幽怨的语气开口说道:“任务大家都记得了吧?等会我建个群,大家有什么新的想法都可以在群里討论。
另外,这个课题前期的准备工作很多也很繁琐,大家平时可以留意下,对我们这个课题感兴趣的,可以介绍进组。
以后如果没有特別的成果,我们维持每周一次的会议討论。时间会选在周末,希望大家都能儘量参加。今天就到这儿吧。”
会议结束已经晚上九点多了。
乔源考虑了片刻,还是决定跟骆余馨直接回寢室。这边离学校东门更近,打车方便。
学校这块的规定比较让人费解。
如果是学校的老师跟学生,打车进学校可以。但空驶运营车辆却不允许进入学校。
天气好也就算了,外面下著雪乔源实在不想再回一趟研究中心。
“袁老把华清的文献资料库访问权限都给你了啊?”
“不知道是不是袁老给的。今天我看邮箱,昨天华清数学科学中心给我发了封邮件。里面有个帐户跟密码。”
“那还能有谁能做这个主,哎……乔源,我真有点嫉妒你了。”
乔源选择了转移话题。
“鲁师兄住在哪啊?”
“他啊,应该是住万柳公寓,更远。”
乔源不吭声了,果然给他安排的已经是最好的了。
“对了,今天我提到雅典娜的凝视项目,感觉大家都想笑,怎么回事儿?”
“还能是怎么回事儿,想到了那位周教授唄。”
“周教授怎么了?”
“他啊,拿到这个项目后一直没成果,有次会议上就说关於张量伺服器的算法这块应该求助於一些国外的数学家。
毕竟对方这块研究一直处於行业领先的水平。但有为也有自己的考虑,尤其是具体算法属於商业机密,当然不可能答应。
据说之前他私底下还说有为的算法也算不上先进,这么固步自封只会耽误自己的时间。
结果他两年多没干成,还到处宣扬应该找人帮忙的事,你两个月搞定了,可以想像有多丟人啊。所以你今天突然提到,有人想笑很正常。而且周顺义本来就不怎么受人待见。不然你以为我为什么会打电话直接当面懟脸?”
乔源眨巴了两下眼睛,他终於明白为什么那天跟周教授见面时,能明显感觉到对方对他不太感冒了。“那为什么让他来主持有为的项目?”
“爭取到的唄。有为的项目有油水的,更別提人家还有个好爹。而且这人也不是完全没水平,毕竞正经哈佛博士毕业的。”
“好爹?”
“不然呢?不过他爹应该也七十多了,在过几年也没那个影响力了。哈哈,而且被你这么横插一脚,以后他还想更进一步估计难咯。”
