11月17日,由StarRocks社区发起、镜舟科技主办的StarRocks年度大型技术交流峰会StarRocks Summit2023在上海举行。
本次峰会以“极速进化,融合‘新’生”为主题,40余场分享演讲在全天密集开展,来自平安银行、华润、腾讯游戏、阿里云、伊利、美的、京东等头部企业的大数据专家围绕数据进化、需求进化、技术进化,细致讲解大数据分析的最新技术和最佳实践,为大数据分析行业呈现了一场精彩的技术盛宴。峰会吸引了数百名企业用户代表和开发者到场聆听交流,另有数万名数据分析爱好者、从业者线上参会。
加速向各行各业渗透
这是StarRocks第三次举行年度技术交流峰会,亮相的企业用户代表既有腾讯、阿里、京东等在去年峰会上分享过经验的互联网“老面孔”,也有不少来自金融、制造、零售等行业的新面孔,比如伊利、平安银行、芒果TV等企业是首次派代表到场演讲。
作为一款开源OLAP数据库产品,StarRocks加速向各行各业渗透,大用户阵容也在不断扩大,截至目前,已有超过300家市值10亿美金的企业使用StarRocks。在大用户示范和带动下,中小企业用户规模迅速壮大,StarRocks社区用户已突破1万,并保持着高速增长态势。
另外,根据峰会演讲嘉宾透露的使用情况,用户对StarRocks的部署规模也在快速增长。
其中,腾讯游戏公共数据平台部总监崔玉明介绍,腾讯游戏已上线近100个StarRocks集群,共有1470个BE节点,1300个CN节点,湖数据量达4.99P。镜舟科技CEO孙文现介绍,镜舟科技基于StarRocks打造的企业级产品全年经历了近百次POC,成功率达到90%以上。
湖仓一体是数据演进趋势
本次峰会共设置了一个主论坛、四个分论坛,除了企业用户代表基于实践的经验分享,开发者代表进行的功能诠释同样精彩。过去一年,StarRocks先后发布了2.5、3.0、3.1三个重磅版本,其中3.0版本推出的存算分离架构为开源业界首创,曾在行业内引起巨大反响。
StarRocks TSC Member、镜舟科技CTO张友东介绍,升级到存算分离架构后,用户的存储成本能下降80%,而计算节点则因为无状态,可以通过快速弹性、跨可用区部署等方式来提高计算的可用性,并且计算资源能够进行物理隔离,按需独立弹性伸缩。到3.1版本,开启Local cache的情况下,存算分离架构下的性能表现已接近本地存储的水平。
与此同时,现在 StarRocks的湖仓分析能力已非常完备,不仅支持internal、Data lake、JDBC、ES等catalog,还支持跨数据源的联帮分析。另外,主键模型的能力在过去一年也得到持续提升,已经同时支持全内存和持久化的索引,并支持了partial update、conditional update的能力,在性能方面,针对批量更新的场景,引入了按列更新的模式,性能相比按行更新提升10倍以上。
张友东表示,未来数据演进的趋势是湖仓一体,用户无需关注是建湖还是建仓,不管是构建数据湖还是构建数据仓库,企业最终的目标是低成本、高效的解决数据分析问题。StarRocks 在具备存算分离、湖仓分析、物化视图等一系列重量级特性后,实现了往Lakehouse引擎的升级,借助StarRocks可兼具数据湖和数据库仓库的优势。
进化故事还在继续
据张友东介绍,未来StarRocks还会朝着云原生方向继续迈进,推动实时分析链路进一步精简,通过ETL on lakehouse,all in one的作业模式,帮助企业低成本、高效率发掘数据价值。
值得一提的是,StarRocks社区是由镜舟科技与阿里云、腾讯、小红书、滴滴等互联网公司共同建设,包括全局字典函数、同步物化视图增强、Paimon Catalog等在内的许多feature都由互联网大厂贡献,以后注定也还会从大厂生产环境中持续吸收灵感和助力。
与此同时,围绕StarRocks形成的商业生态也越来越完善,以镜舟科技为代表的商业团队不断提升着产品的易用性、稳定性,将产品能力落地到复杂的需求环境中,创造更大价值。