旗下平台: 媒体+ 驱动号 阿里汽车 非常在线

求尔创客「Terark」韩東:自研压缩算法领先业界3~5年,阿里“双十一”就靠它

  • 来源: 驱动号 作者: 求尔Qerte 2018-11-12/18:04 访问量:
  • 第三十一期专访「Terark&火炬研究院」联合创始人——韩東

    “未来,大数据在体量和存储上会越来越大,我希望通过团队的努力保护企业资产的安全性、可控性,尽可能减少企业在数据能源上的消耗。”对于Terark的发展愿景,韩東如是说。

    「Terark&火炬研究院」联合创始人韩東

    文字 / Bella

    剪辑 / Chris

    在库布齐来一场自我放逐

    一个地方让你念念不忘,大概是那里有你深爱的人,或是一去不复返的青春。

    韩東属于后者。

    他常说:“行走在库布齐的无垠沙漠,来一场心灵的自我放逐。”

    沙漠的静、沙漠的夜,让长久生活在城市喧嚣的人们感受到漫天星光的浩瀚璀璨。

    2013年的夏天,韩東和朋友们来了一场有意义的沙漠运动——“数码排毒”。

    韩東说:“这次运动的意义就是让人们远离了一切电子产品。上不了网,没有信号,打通电话都要跑到山头上。”

    正是这次体验,令他重拾了年少时的理想。

    这便要从他上学时开始说起。

    韩東自嘲自己是70后思想+80末年龄+90后面孔,大学还没毕业时便进入全球最大的中文程序员IT社区CSDN实习、工作,师从软件编程语言方面的专家张孝祥老师。

    在CSDN期间,锻炼了他的实操技能和产品思维,使他接触并意识到了底层技术的重要性。

    2012年跨年狂欢的第一天,张老师突发疾病不幸离世,使整个CSDN及IT界陷入莫大的悲恸之中,同门们三三两两的都在痛苦追忆中寻求新的发展。

    韩東先后从北京来到无锡、上海、深圳等地,从最初的产品、研发到参与某知名“交易所”项目,事业发展可以说如日方升。

    一切变故发生在2013年,父母身体抱恙,孝义先行,他决定回去照料父母。

    “朋友常说我是26岁的年纪经历着62岁的人生,父母生病后感觉自己一下就长大了。”他如是说。

    之后的大半年,他都在床榻边守护着母亲,直至他们陆续出院。

    极客,追求极致

    他说:“从库布齐回来后,我和以前的同事还有投资人朋友一起做了项目,就是微信海外版业务,主要做海外公司主体下的微信公众平台和支付。”

    2014年,微信布局海外的时候,受到海外用户移动应用习惯的影响,进程比较缓慢。

    他说:“当时团队在北美做了3000+的商户,基于微信生态下,为这些商户做流量的推广及变现服务。这件事做了一年多,取得了一定成效,尤其在美西地区,明显感受到我们属于先驱者。”

    现在我们去美国一些城市,无需经过外币换算,通过微信即可完成支付。

    2015年底,眼看事业刚有点起色,家里又迎来了急报。

    他的父亲住院了,强烈的无助感席卷全身。

    就在这一时期,在朋友的推荐下,他结识了Terark的创始人雷鹏。

    与雷鹏接触下来,他认为雷鹏是典型的极客。

    “雷鹏对大数据有着近乎“狂热”的兴趣,愿意花一辈子时间去钻研。”

    由于趣味相投,一见如故,韩東决定跟雷鹏一起创业!

    随着城市生活节奏的加快,追求风潮、追求速度一度沦为主流,IT界也是一样,真正肯钻研底层技术的团队并不多。

    如果说数据库是底层,那么存储引擎就是底层的底层。

    韩東告诉求尔,“用投资人的话说我们正在啃了一个最难啃的口,但以往的实践经验告诉我,它创造的价值不可估量。”

    2015年11月,Terark宣告成立。

    团队成员由最初的三人行,慢慢壮大,都是来自雅虎北研所、微软亚研院、谷歌、百度、360、CSDN的老朋友。

    他说:“大家都是做技术的,非常好沟通,我们看中的是大数据时代到来时,项目在数据存储量方面发挥的极大优势。”

    现在看来,Terark团队当初的坚持,是必要的。

    天使融资,签约阿里,进入YC训练营

    如果你是一位美剧狂热粉,不可能没有看过HBO连播的《硅谷》,想必你对剧中Pied Piper(魔笛团队)印象深刻,他们创造了一套很牛的压缩算法。

    Terark就是现实版的Pied Piper。

    韩東告诉求尔,Terark自主研发的技术(TerarkDB)无需解压即可在压缩数据中进行搜索,用软件代替硬件,极大地提升了内存与硬盘的使用效率。

    TerarkDB 是一款压缩率最高、随机读最快的存储引擎。它兼容 MySQL、MongoDB、RocksDB 等存储系统,使得随机访问加速 10~100 倍,存储空间减小 3~10 倍。

    保持访问速度的前提下,通过全局压缩实现超高的压缩率

    据了解,目前国内还没有找到他们的同行或是竞品,国外像是Facebook,Google等同类产品,从性能及性价比上Terark也是遥遥领先。

    “在技术层面我们有绝对的自信,Terark的技术壁垒还可以领先业界3~5年的水平。”

    就是这套令无数IT大牛叹为观止的压缩算法,被Terark团队成员在半年的彻夜“奋战”中,攻克了下来。

    韩東说:“技术研发的背后一定离不开两批人,一批是在‘前线’努力钻研算法的人,一批是在背后给予支持的人。”

    他特别感谢在创业之初遇到了“真正的天使”,在Empower Investment 与道合资本的帮助下,Terark团队才能在没有后顾之忧的前提下,精心攻克一个个技术难关。

    同样,Terark团队不负投资人所托,在2016年凭借自身技术优势,与阿里云签订合作协议。

    2016年Q4,Terark团队凭借出色的底层算法,通过仅有千分之一通过率的硅谷著名孵化器Y Combinator 的严格评估筛选,作为唯一的中国创业团队成功入选YC2017冬季训练营。

    早在2012年,《福布斯》便将YC评选为最有价值的孵化器。其中,云储存服务提供商Dropbox和房屋短期租赁网站Airbnb等独角兽都曾是YC的入驻企业。

    好的技术如何实现价值最大化

    韩東兴致勃勃的向求尔讲述Terark在YC100天孵化后的小插曲,自认不善言辞的他,现在竟实现了在万千听众面前的激情路演!

    这之后,Terark团队不仅在技术攻坚上不断开拓,还格外注重提升产品的市场价值。

    在产品问世初期,Terark团队已经为雅虎、猎豹、新浪等企业提供技术服务。

    “我们的产品投入使用后,从数据存储量上至少能够节省掉一半,成本也将随之递减。比如当时雅虎北京使用之后,每周仅电费就能省十五万美金左右。”他解释说。

    最近,韩東和团队忙着为2018年的“双十一”做准备。

    与阿里云签约后,Terark作为核心技术供应商已经为“双十一”活动保驾护航了两年多。

    他说:“用户感知不到我们的存在,但每一笔交易的背后都有我们的身影。”

    这不仅保障了亿万用户的购物权益,还为阿里节省了资源、空间及输出成本。否则,仅“双十一”就可消耗更多的服务器所带来的巨大成本。

    如今,Terark是阿里云核心数据技术供应商以及京东OCR技术服务商。

    用软件代替硬件,让数据库变得更快,是Terark创业以来一直在做的事情。韩東认为,新时期结合市场走向,软硬件可以结合发展,并且从单一的“卖产品”到“卖解决方案”,实现产品价值最大化!

    据了解,Terark会推出一个面向中小企业的,可以进行便携数据库运维管理的智能工具,通过SaaS的形式为企业提供服务,同时集成了基于AI的运维机器人,让中小型企业不再需要DBA。

    不久的将来,Terark还会将核心技术集成进入区块链领域,实现一套基于“可检索压缩技术”的分布式存储数据库和智能策略系统。

    图片来源于Terark、天猫、微信。


    赞(0)

    驱动号 更多