Niankong Technology Wang Xiao的对话:对冲资金的方式
作者:BET356官网在线登录 发布时间:2025-05-25 09:48
资料来源:36KR行业的数量重新显示了AI光,Niankong首次将大型模型层的底层带到了国际领先的会议上。资金 +大型模型=?半年前,当面对这个算术问题时,大多数人都会回答Deptseek,但是通过发表论文研究,出现了一个新的答案,即Niankong的技术。 5月15日,Niankong Technology的私人资产量与国际顶级会议NIPS上的上海Jiaotong计算机科学技术学院合作提交了大型研究榜样,以讨论“自适应混合培训甲基甲基甲化物学”。这个故事不是大型模型中的私募股权的数量如何获得丰富的回报,而是“已经从事自己的业务”,并在大型模型的基础理论中产生了研究结果,这成为第一个在NIP中损坏的中国机构。在n之前Iyankong,DeepSeek是唯一一家私募股权孵化的公司,对大型模型和已发表研究结果的基本理论研究进行了研究。与“ Senius”相比,Niankong又迈出了一步。基于DeepSeek,Niankong提出了一种新的更好的培训方法,以帮助大型模型提高培训效率。这是数量行业中现代研究的少数大型模型之一。从技术的角度来看,DeepSeek提出了研究强化的重要性。 Niankong Technology董事长Wang Xiao和他的团队被发现在一段时间内进行了集中的SFT(管理微调)的实践,然后进行集中式RL(增强研究),交替的SFT和RL可以取得更好的培训结果。行业数量一直称为AI孵化器。 Niankong的现代技术使AI能够更好地重返数量行业。王小发现那是”在以前的AI财务数据经验中,财务数据的数量较小,信噪比较低且不稳定。算法的机械和深入研究的传统机械研究超出了适当的数据集。大型模型可以帮助进行财务数据预测。“大型替代与传统的机械研究完全不同。大型模型可以带来超越子工作数据本身的信息,并具有跨模式的理解功能。 “不仅具有现代技术,而且还具有工业融合,学院和研究,Niankong和Shanghai Jiaotong大学计算机科学学院之间的合作也是一种重要意义。计算和工程经验,但它具有人才,理论研究的好处,理论研究和项目的方向,这是更好地集中在层面技术的领域,同时促进了底层技术的突破性,以促进促进技术的突破性,以促进促进技术的突破性,以促进其实施的实施,以促进其实施的领域,以促进良好的领域的突破性。Tion和两者在AI时期实现了Winimpep的变化的结果,大型模型应经历研究“大学”“大学,研发”之外的阶段,占据了科学和技术变革的“浪潮”,并打破了传统的封闭门槛研究模型。公司的手势经常决定其未来的命运,并与学术界紧密相关,因此它有机会真正成为大型模型行业的“摇篮”。可以减轻一个小的学术“种子”,但可以在各个领域和行业中实施和开花,改变普通百姓生活的各个方面。在数量行业中,从未有大型模型的成熟应用。 Niankong的技术可以是通过“生产,教育和研究”来实现大量投资的“第一人”。王小告诉36kr,如果您想更好地应用AI I在金融领域,您必须了解大型模型的基础层如何工作。在Wang Xiao和他团队的大型模型上的培训经验中,他们意识到所有领域的培训的基本工作大纲通常是相同的,因此很容易将垂直领域的训练轮廓移至另一个领域。一项不能直接证明Niankong具有更多“野心”的行动 - Niankong的技术也被消耗和建立了Allmind(完整的频率思维)。将来的主要任务是研究大型模型的基本算法和工程技术,同时关注包括但不限于财务状况的垂直应用程序。该体积可用于大型模型,可以使用的能量远非想象力。在越来越多的关注市场应用部分的背景下,Niankong可能从财务AI开始,并推动大型模型向前迈出一步。仅通过rebu将全球人工智能竞争风景弄清可能是潜在的大型模型行业的潜在释放。企业和大学的结合也可能允许中国模式的基本能力前进。主要原因之一是中国行业积累的数据和语料库是独一无二的。对于大量的机构来说,对基本理论研究的持续投资并不是明显恢复投资的东西,并且由技术驱动的长期投资。 Niankong选择加深他在这一领域耕种的长期企业足以展示他的战略观点。自2019年以来,Niankong Technology已将变压器算法应用于实时产品组合,并且这种完整的情报大大提高了战略制定的效率。从全球的角度来看,自大型AI模型的竞争以来,数量行业积累了长期的EX具有AI算法的意识是对位置的需求。同时,国际巨型销量仍处于探索,实验和援助该模型投资的阶段。 Iankong的选择也是适应市场变化并事先准备“达到曲线”。通过投资数量,Technolo Carryshame AI可以进行多少可能性?探索大型型号的Niankong技术有多少潜在的技术?在这些问题的脑海中,36KR与Niankong Technology的创始人Wang Xiao进行了对话。以下是访谈的详细汇编:Niankong产生了一个很大的模型:准备战役36KR:作为一家全球对冲基金公司,Niankong如何开始自己的AI道路?为什么纸张出现在大型模型领域? Wang Xiao:2017年,我们建立了一个三人AI团队,使用某些机器学习算法测试财务数据。第一个项目是未来的,但是期货数据的数量是小小的。当将机器学习算法应用于具有少量数据的样品时,它们易于过度合适,并且不会获得Oneg的好结果。 2018年,当应用于股票时,发现效果很棒,因为股票中的数据量大于期货。到2019年,我们已将90%的在线真实磁盘模型更改为神经网络算法,尤其是变形金刚。在2021年,我们的量表达到了100亿,因为整个过程很好地应用于机器和神经网络算法的研究。 2023是另一个节点。当Openai问世时,我意识到大型模型对于财务数据预测很有用,因为大型模型可以将信息带到子任务本身之外,并具有跨模式的理解能力。过去,当我们应用这些AI算法时,大多数管理培训是适合历史数据,但是BigModel的主要逻辑是不同的,因此我们认为这可能是可以PR的另一个模型命令金融市场。 DeepSeek今年的出现不仅带来了聪明的平等,而且表达了教育的重要性。以前的大型模型更多地集中在管理的微调预训练上。因为我们总是对大型模型有一定的了解,并积累了巨大的计算算法和力量,所以我们对今年的大型模型进行了基本的理论研究,这就是这一角色。 36KR:似乎Niankong做的研究似乎非常剪裁。您能解释一下与DeepSeek不同的“自适应混合训练方法”是什么? Wang Xiao:从DeepSeek的培训方式中,我们可以看到他们的技术更像是专注于在一段时间内研究Mmake问题(SFT),然后专注于在一段时间内进行测试,以及思考和总结测试结果(RL)。我们受到人类学习方法的经验的启发。如果我们在高频写作问题之间移动nd摘要测试经验,提高学业成绩(推理能力)可能会更愉快。因此,我们设计了一种用于切换到SFT和RL的步骤步骤的训练方法。在进行下一步培训之前,我们决定是否根据我们设计的自适应算法使用SFT或RL进行下一步。最后,我们的实验发现,在三个不同的公共数据集中,我们建议的新培训框架比仅仅是SFT,RL仅与SFT AndRL混合了要好得多,这证明了我们建议的新框架是目前更好的培训后培训技术。 36KR:我们注意到,这个角色是与上海北海大学计算机科学技术学院合作的,那么为什么它选择“通常创建”大学呢? Wang Xiao:如果您想使用大型型号进行垂直培训,则必须首先了解大型模型培训的所有细节。这也是我们这样做的起点纸。我们与大学合作的原因是因为学术和行业在模型的伟大研究中具有自己的优势和缺点。工业和教育的结合可能在从优势和劣势中学习中发挥作用,这确实使国内基础研究能够在人工智能方面。 36KR:本文的结果确实很少见,因为许多AI公司从基础模型的研究中撤退。 Wang Xiao:是的,但是更值得关注的是 - 停止,然后?像Thyi Qianwen 3一样,参数仅在Deptseekisa中排名第三,但其功能超过了DeepSeek。这种类型的模型具有较少的参数,但功能强大的模型将增加和所有开放资源。将来大多数公司最伟大的竞争是如何正确使用大型模型以及如何更好地训练它们。大型模型就像一个智商很高的一般天才,但是即使这样一个人没有正确的方式教他如何投资D计数,他不能“从零帧开始”。这样做的基础是首先了解大型模型的基本原理。了解大型模型的基本原理的最佳方法是不阅读一千篇论文,而是直接开始培训。 36KR:在本文合作的过程中,“补充”“辅助”纸“上海”上海jiaotong大学计算机学院?双方的学术经验都可以避免他们的弱点,并共同努力AO:我们有一个自发开发的垂直模型,它基于Tongyi Qianwen 3。进行一些理论研究时,我们通常使用Qianwen模型进行培训和实验。从金融AI开始,不仅是AI36KR金融:Niankong AI团队的规模是多少? Wang Xiao:对于整个团队来说,有十二名AI工程师,70%至80%受到大学本身的培训,而社会只鼓励了少数人。 36KR:就大型模型工程师的招聘而言,在学校从头开始训练的选择似乎是该行业的共同特征。这相当于从学校开始的行业数量的应用功能的舔library。 Wang Xiao:是的,由于我们公司的内部平台是由IT团队完全编写的,如果它在此模型中产生特征因素或培训,那么它是关于在非常标准和集成的框架中做事。因此,如果另一方有能力,他或她可能实习后,在我们公司的一项熟悉的研究中,他对我们公司的研究工具非常熟悉。 36KR:Niankong还建立了一个独立的AI公司Allmind(全乐队思维)。公司内部AI团队的劳动分工是什么?为什么要创建一个单独的全态? Wang Xiao:Allmind的AI团队和Niankong的AI团队在工作内容方面有很大的劳动分工。 Niankong AI团队的Panguthe AI团队是使用机器研究和深入研究算法来适合财务数据。场景相对垂直,主要负责特定问题模型的技术研究和建模。 Allmind的主要任务更多是关于大型模型,包括大型工程技术优化和研究研究,对COT数据的高质量平房生产的学术探索,包括大型大型领域的研究工作以及垂直应用程序财务场景。我们期待在基本AI研究中进行突破,以在包括财务在内的更多领域散发出来,为业务提供更多的可能性和想象空间。因为这个简短是私募股权基金和有利可图的业务的少女,而AllMind则更多地关注大型模型的基本学术研究和应用。这不是短期内收入的目的,两家公司的工作内容完全不同,因此AllMind是单独建立的。 36KR:不仅限于财务方案中有关垂直应用的其他研究,如何从Ikong计划开始? Wang Xiao:由于AllMind具有一定程度的经验和大型模型中涉及的工程算法和技术的经验和认知积累,以及我们的SFT和RL使用大型模型在财务数据中的培训后经验,我们意识到,所有领域的基本培训大纲通常是相同的,因此很容易。为example,所有字段都需要高质量的提示和COT数据,并且需要SFT才能使模型在进行加固研究之前先获得对特定领域的基本理解。两者都需要一个正确的奖励模型。在短期内,AllMind将专注于基于财务数据的特殊大型模型培训,并且还将着重于解决当前大型模型中的一些痛点,例如提高大型大型的逻辑推理能力,从而减轻大型模型的幻觉问题,并探索大型模型是否可以改变联合。将来,我们将与学术和行业合作测试大型模型在新材料,研究和制药,AI助手等领域的应用。毕竟,这是一个巨大的市场,而且没有特别好的产品。 Wang Xiao:我们真正地从事一个相对的工作RTATIC项目,可以由普通投资者使用,并更好地帮助中小型投资者进行良好的交易。 AI是否重新编写传统数量历史? 36KR:AI模型的贸易模型数量是否相关?他们有什么关系? Wang Xiao:卷的作用是真正的预测未来。预测未来的基础是总结以前的经验。例如,过去五年来A股市场政策是什么,然后应用这些政策赚钱是基础的大坝Logici。如何总结过去?有两种方法,一种是线性模型,另一种是使用AI算法的非线性模型。添加所有有影响力的因素,并在没有适当工具的情况下进行线性添加。它是一个普通的多因素系统。另一种方法是通过研究机器和深入研究算法来训练过去五年的基本数据和某些功能,然后让模型总结并进行SUMmarize过去五年的法律。这是一个非线性模型。通常在AI算法的最低级别上找到传统数量公司使用的AI技术,该算法适合并总结过去的历史。我们现在认为,除了直接适合全日制机器算法之外,直接使用大型模型进行SA预测也是一种可行的方式。 36KR:如何检查模型量的质量?因素数量很重要吗? Wang Xiao:SO称为的模型量或体积模型实际上分为两种类型,一种由统计驱动,另一个由逻辑驱动。如果只有两个因素,但是这两个因素是由逻辑驱动的因素,那么即使只有两个因素,它们确实可以有所帮助。但是,如果这两个因素基于统计数据,例如采矿机研究或调整一些数据,那么它们将在历史上计算,那么这两个因素是危险的。在数量方面,更好。与2,000个因素相比,10因素当然还不够。但是,与2,000个因素相比,20,000个因素效果更好吗?噪声也会增加。 36KR:幻觉问题会影响音量过程中的大型模型吗? Wang Xiao:有一个称为IC的行业数量的指标。 IC是正确答案与您预测的答案之间的关系。如果完全正确,则IC为100%。实际上,例如,库存选择的α模型,其IC可以为15%至20%,这意味着其预测是不准确的。不准确的组件也可能被视为幻觉,但交易量不需要100%的获胜率。尽管获胜率只有49%,但它可以赚钱。重要的是要在模型开发并及时消除失败的模型之后保持很长时间。 36kr:那么,真的使用AI不必提高性能吗? Wang Xiao:使用AI不仅不需要提高性能,而且性能可能很难Ult。您可以很好地适合培训数据。您认为自己配备了非常聪明的模型,但是如果您要玩游戏,将来将其应用于数据后,这可能是完全错误的,您会让您损失很多钱。 36KR:似乎对于音量模型的护城河似乎仍然很高,甚至传统的互联网制造商似乎也很少进入此字段。 Wang Xiao:这个问题是Internet上使用的AI与AI经济使用的最大区别。我们从互联网上招募了许多AI工程师,并要求使用AI算法来获取AI模型来预测股票的收益,但我们发现,10名工程师中至少有8名将失败。 Internet中的数据量是压倒性和稳定的。它们可以在互联网行业使用AI技术“易于”,但是财务数据并不相同。财务数据非常小,不稳定,信噪比的比率很低。例如,在学习了过去五个的市场环境之后多年来,您发现了一个规则:经过连续三天的股票,它们将在四天内继续上升。牛市可能是这种方式,但这可能是未来三年的熊市,这一规则将失败。因此,在互联网行业中,训练大型语言模型的困难是如何解决算法和工程问题,因为它需要尽可能多地连接GPU和服务器进行良好和大型培训。与GPU的金融行业共同连接没有问题,并且服务器确实足以培训。但是您不能适当地习惯它,因为如果您还适合一些不正确的政策,那么如果未来的市场未重复或完全相反,则可能会损失钱。因此,大型财务模型的困难在于如何在过度拟合和拟合不足之间找到平衡。
电话
020-66888888