您当前的位置:首页 > 互联网百科 > 大数据

腾讯开源数据组件 Fast-Causal-Inference,用于分布式向量化统计

时间:2023-09-18 11:06:46  来源:IT之家  作者:

IT之家 9 月 18 日消息,腾讯在其公众号“腾讯开源”中宣布,旗下开源分布式数据科学组件项目 Fast-Causal-Inference 目前已经在 Github 中公布。

▲ 图源 “腾讯开源”公众号

据悉,这是由腾讯微信研发,采用 SQL 交互的,基于分布式向量化的统计分析、因果推断计算库,据称“解决已有统计模型库 (R / Python/ target=_blank class=infotextkey>Python) 在大数据下的性能瓶颈,提供百亿级数据秒级执行的 Causal inference 能力,同时通过 SQL 语言降低统计模型使用门槛,易用于生产环境中,目前已在微信视频号、微信搜一搜等微信内部多个业务进行了应用。”

官方介绍:

提供海量数据秒级执行的 Causal inference 能力

基于向量化 OLAP 执行引擎 ClickHouse / StarRocks,速度上更益于极致化用户体验。

极简的 SQL 使用方式

SQLGateway WebServer 通过 SQL 语言降低统计模型使用门槛,并在上层提供极简的 SQL 使用方式,透明做引擎相关的 SQL 展开和优化。

提供基础算子、高阶算子的因果推断能力,及上层的应用封装

支持 ttest, OLS, Lasso, Tree-based model, matching, bootstrap, DML 等。

IT之家同时得知,官方表示,首个版本已经支持如下特性:

基础因果推断工具
  • 基于 deltamethod 的 ttest,支持 CUPED
  • OLS,亿行数据,亚秒级
进阶因果推断工具
  • 以 OLS 为基础的 IV,WLS,以及其他 GLS,DID,合成控制,CUPED,mediation 正在孵化
  • uplift:千万数据分钟级别运算
  • bootstrap / permutation 等数据模拟框架,解决没有显示解的方差估计问题


Tags:数据组件   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除。
▌相关推荐
IT之家 9 月 18 日消息,腾讯在其公众号“腾讯开源”中宣布,旗下开源分布式数据科学组件项目 Fast-Causal-Inference 目前已经在 GitHub 中公布。▲ 图源 “腾讯开源”公众号据...【详细内容】
2023-09-18  Tags: 数据组件  点击:(0)  评论:(0)  加入收藏
▌简易百科推荐
IT之家 9 月 18 日消息,腾讯在其公众号“腾讯开源”中宣布,旗下开源分布式数据科学组件项目 Fast-Causal-Inference 目前已经在 GitHub 中公布。▲ 图源 “腾讯开源”公众号据...【详细内容】
2023-09-18    IT之家  Tags:数据组件   点击:(0)  评论:(0)  加入收藏
数据管理和数据治理可能很难向新手解释。它们涵盖了复杂的数据能力领域,例如元数据管理、数据质量、数据架构、数据编目、数据隐私、数据科学和数据集成。我发现自己在为客户...【详细内容】
2023-09-17  数据驱动智能  51CTO  Tags:数据治理   点击:(3)  评论:(0)  加入收藏
随着大模型掀起新一轮 AI 热潮,人们开始思考:大模型的强大能力来源于什么?当前,大模型一直在由不断增加的「大数据」来推动。「大模型 + 大数据」似乎已经成为构建模型的标准范...【详细内容】
2023-09-14    机器之心  Tags:数据   点击:(3)  评论:(0)  加入收藏
随着科技的飞速发展,大数据技术已经成为许多领域的重要工具。在公共卫生领域,大数据的应用也日益广泛。本文将探讨大数据在公共卫生领域的应用现状及未来发展趋势。一、大数据...【详细内容】
2023-09-14  小动漫故事    Tags:大数据   点击:(7)  评论:(0)  加入收藏
在信息时代的浪潮中,大数据成为各行各业的宝贵资源。然而,要从海量数据中发现有价值的信息并获得洞见并非易事。这就需要依赖于先进的技术手段,其中人工智能(ArtificialIntellig...【详细内容】
2023-09-13    无心生活  Tags:大数据   点击:(2)  评论:(0)  加入收藏
译者 | 李睿审校 | 重楼在大数据时代,高效的数据管理和查询性能对于希望从数据投资中获得最佳运营性能的企业来说至关重要。Snowflake是一个基于云的数据平台,它为企业提供了...【详细内容】
2023-09-12    51CTO  Tags:Snowflake   点击:(8)  评论:(0)  加入收藏
前言近年来,随着数据挖掘,机器学习等技术的发展与深入,企业从普通用户处收集到的大量的数据就变得越来越有价值,对这些数据进行分析处理可以更好的了解用户的习惯和喜好,从而向用...【详细内容】
2023-09-07  用九智汇  嘶吼网  Tags:数据   点击:(16)  评论:(0)  加入收藏
译者 | 布加迪审校 | 重楼“数据网格”正迎来重大时刻。通过谷歌新闻粗略地搜索一下,你会看到几十个相关的结果,而且种类繁多。随着众多新技术不断进步,这种情况正在发生。此外...【详细内容】
2023-09-07    51CTO  Tags:数据网格   点击:(12)  评论:(0)  加入收藏
在现代科技的推动下,数据已经成为推动机器学习和人工智能进步的关键因素之一。构建一个优质的数据集对于培养高效的机器学习模型至关重要。然而,数据集的收集并不是一项轻松的...【详细内容】
2023-09-07  技巧达人小影    Tags:数据集   点击:(13)  评论:(0)  加入收藏
在当今数字化时代,数据已成为决策制定和问题解决的关键要素之一。然而,有时我们面临的挑战是数据不足。在大多数情况下,数据科学家和研究人员依赖于大型数据集,以训练和验证机器...【详细内容】
2023-09-07  马海连    Tags:小数据   点击:(16)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条