腾讯开源Fast-Causal-Inference项目 解决数据性能瓶颈问题
9月18日消息,腾讯近日在其公众号“腾讯开源”中宣布了一项重要消息,旗下的开源项目Fast-Causal-Inference正式登陆GitHub平台。这一项目由腾讯微信团队研发,致力于解决数据科学领域中的性能瓶颈问题,为因果推断和统计分析提供了全新的解决方案。
据悉,Fast-Causal-Inference是一款基于分布式向量化的统计分析和因果推断计算库,其最大特点之一是采用SQL交互方式,这使得用户可以通过SQL语言更轻松地进行数据分析和因果推断。与此同时,该项目还充分利用了向量化OLAP执行引擎,如ClickHouse和StarRocks,以实现海量数据的秒级执行能力,为用户提供了卓越的性能体验。
官方表示,Fast-Causal-Inference的首个版本已经支持多项重要特性。其中包括基础因果推断工具,例如基于deltamethod的ttest和CUPED。此外,该项目还提供了OLS工具,能够处理亿行数据并在亚秒级内完成分析。在进阶因果推断工具方面,Fast-Causal-Inference支持IV、WLS等高级算法,同时还在孵化中加入了诸如GLS、DID、合成控制和mediation等功能。对于大规模数据,这个项目还支持Uplift建模,并提供了Bootstrap和Permutation等数据模拟框架,解决了方差估计问题,提高了统计推断的可靠性。
据ITBEAR科技资讯了解,Fast-Causal-Inference已经在腾讯内部的多个业务中进行了应用,包括微信视频号和微信搜一搜等。这标志着这一开源项目在实际生产环境中得到了验证,并且为数据科学家和分析师提供了一个强大的工具,帮助他们更有效地进行因果推断和统计分析,尤其是在处理大规模数据时。腾讯的开源举措将有望为数据科学领域带来更多创新和进步。



上一篇:中国Huggingface登顶全球AI行业流量榜首
下一篇:返回列表
生活日报网·版权声明
本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
本网站所提供的信息,只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误,对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内,本网站在此声明,不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。
【特别提醒】:如您不希望作品出现在本站,可联系我们要求撤下您的作品。邮箱 sunny@sdlife.com.cn