时间: 2015年7月17〜18日
地点: 深圳·大梅沙京基海湾大酒店

专题: 大数据背后的价值

Day of week:

大数据在这几年获得了IT技术圈乃至全社会的广泛关注。有一种说法是很多行业的人只是说大数据,而不知道真正该怎么做。在本专题,希望能把各行各业真正在做大数据的各位专家请过来现身说法,通过他们的案例,讲讲大数据的相关技术,在除了IT(尤其是互联网)行业以外是如何运用的; 分享在各自领域内,如何用数据驱动的方式,解决各类问题。希望各位专家的精彩报告,能为他们彼此同时也为来自各行各业的听众带来如何用好大数据思维与技术的想法与启发。

专题出品人:
沈志勇
百度数据科学家

博士,百度研究院大数据实验室数据科学家,负责基于大数据行业应用探索方向,联合国百度大数据联合实验室决策委员会成员。本科毕业于北大数学学院概率统计专业,随后于中科院软件所获得博士学位,研究方向为数据挖掘。曾任惠普中国研究院研究员,研究领域包括机器学习与数据挖掘。从事大数据领域研发多年,在大数据相关主流期刊与会议上发表论文多篇,并拥有若干相关技术专利。


by 徐梦云
饿了么数据技术部总监

饿了么数据仓库从零开始到数据架构建设,从最初的快速响应业务需求,到探索适合饿了么业务本身的模型建设,满足越来越多业务人员对数据的需求,以及未来数据架构的探索。包含数据仓库架构,元数据管理,自动化任务配置,数据质量检验体系搭建。

听众受益:海量数据处理者、大数据从业者、数据仓库架构师


by 方林
华大基因深圳研发部副院长

计算和存储是大数据研究中不可或缺的重要技术和支撑,生命科学大数据的研究也不例外。华大在遗传科学这一生命科学的分支上,处于世界领先水平。但他的领先,除了生物技术之外,信息技术也扮演者重要的角色。生命科学大数据计算是数据密集型的计算,但随着精准医疗的开展,计算的模式在逐渐转变,具体何种计算模型适合于精准医疗的研究,需要进一步的探讨。本演讲主要给大家分享华大基因在生命科学大数据计算和存储方面的经验和取得的成绩。

听众受益:生命科学,基因组,生物信息,生物大数据,精准医疗。


by 苏文魁
亚信资深算法工程师

运营商作为数据管道,本身拥有众多的数据资源,具有天然的优势,但如何能够有效利用发挥其价值依然面临种种挑战。本讲座首先分析运营商数据的优缺点,分析运营商数据在营销领域的应用需求,把这些要求转化成系统需求;系统面临的关键问题及解决方案:分布在运营商机房的数据异构及系统异构,用户识别,内容识别,数据安全,应用效果的有效验证等方面介绍方案;结合案例介绍数据应用效果及方案的有效性;最后,对未来运营商数据的应用前景进行展望。

听众受益:

1. 运营商数据的优点及缺点在营销领域应用方向,亚信作为运营商数据应用的先行者之一在实际工作中经常遇到的误区及解决方法;

2. 了解总体架构及多地数据异构机房大数据处理、用户识别、内容识别、数据安全等关键问题中的架构方法;

3. 结合案例讲解运营商数据的应用方向与价值,未来发展的展望。


by 张佶
工商银行技术经理

有效的倾听客户心声是银行全面提升服务水平和客户体验的重要途径。银行每日记录的大量客户咨询投诉,与行外媒体的海量报道评论,无疑是获得客户反馈的最直接有效途径。课题将引领听众共同探索文本挖掘技术在银行客户服务领域的应用:从银行内部的客户咨询投诉的意见特征分析、业务价值发现、业务模型建立,到银行外部报道评论的信息筛选过滤、信息特征提取、信息整合利用,全流程地分享从设计构想到落地实施的经验心得。

听众受益:

1.文本挖掘在客户服务分析领域的实战案例;

2.从无到有将文本数据分析引入银行经营决策视野的成功探索;

3.激活银行海量文本数据的商业价值。


by 邓大付
腾讯数据中心技术副总监

在网游市场规模庞大,增速放缓,竞争日趋激烈的现状下,如何通过大数据技术来实现精细化、个性化的手段来改善用户体验、进一步挖掘用户价值成为游戏运营中的一个核心诉求。探究腾讯游戏大数据精细化运营之路的背后技术,我们并没有革命性的算法体系产生,而是将机器学习算法,大规模并行化计算系统,以及具体的数据和应用场景进行有机结合方面的应用创新。

1: 面对数百款游戏,每天新增上千亿条的用户数据,我们如何来进行实时的采集入库,如何进行存储。存储后的数据通过算法如何来应用到游戏的运营中,从而影响游戏的新进,留存,以及付费等生命周期的核心指标?这里,我们会首先会介绍在腾讯游戏的大数据体系的建设。包括有数据体系,系统架构体系,以及算法体系,以及应用场景体系方面的一些基础知识。

2: 用户画像体系是连接基础数据和实际应用场景的纽带,这个部分我们会详细介绍我们如何理解游戏用户以及整个体系建设的一些技术点,例如,一个用户的画像包含哪些描述标签,如何通过图算法来挖掘用户在游戏的虚拟关系链中的位置和作用等。

3: 对于腾讯运营的端游名著,都经历了5~7年的长时间运营,...


by Hien Luu
LinkedIn Engineering Manager

对任何互联网公司的营销团队而言,创建成员分类都是主要工作之一。营销团队会不断创建不同的成员定位信息,以满足营销活动的需求;与此同时,需求是不断变化的。因此,我们就特别需要一个自服务的成员分类平台,它要易于使用,可以伸缩,以支持大规模的成员数据集。

LinkedIn的成员分类平台(LinkedIn Member Segmentation Platform)就是为此设计的,可以解决计算成员属性、创建并服务成员分类、为分类计算逻辑提供中心库等问题。

演讲中将分享LinkedIn的成员分类平台是如何应用MapReduce、Apache Pig、Apache Hive及其他开源软件解决前面提到的这些挑战的。此外,演讲中还将分享过去的两年,这个平台在扩展过程中得到的教训。

希望参会者可以理解如何应用大数据技术解决大数据业务应用,并了解操作和管理大规模数据的一些最佳实践。

演讲专题

Covering innovative topics

7月17日,星期五

  • 研发体系构建

    过程、方法与工具,软件工程落足到开发实践中,就是研发体系架构,它是公司很难处理的组织与推进结构,也是最直接影响到公司效能的生产单元。在不同的公司、团队中研发体系也有大不同。

  • 在线教育

    大规模公开在线课程(MOOCs)正在全球范围引起一股在线教育的热潮,其倡导的基于网络的远程大规模学习服务交付模式也引起了计算机工程和研究界的广泛关注,本专题汇聚了国内在线教育创新公司并分享他们在线教育平台在平台架构、学习分析和用户体验等方面等技术创新和实践成果。

  • 智能硬件

    程序、网络与传统硬件结合将改变我们的生活。本专题将试图讨论嵌入系统、传感器、网络、数据采集与数据分析结合到智能硬件中带来的新体验与服务。 

  • 开源与企业发展

    互联网行业的快速发展源于技术的快速创造、传播和学习,开源软件与开源文化起了重要作用。本专题将试图探讨企业在使用、开发、创造开源项目,以及与开源社区协作的最佳实践。 

  • 云上的基础设施与运维

    云计算基础设施架构是构建弹性与可扩展云服务的基石,而云资源管理是维护业务运行的保障。如何针对不同业务特点,最大程度借助云计算资源优势,进行高效安全的运维管理,是云时代越来越多的企业和开发者关注的核心问题!

  • 应用性能管理(APM)专场

    随着业务级运维、敏捷开发的兴起,应用性能问题对于企业关键业务的影响正变得愈发重要,而APM(Application Performance Management)应用性能管理也同样越来越受到企业的重视。APM,即对软件应用的性能和可用性进行监控和管理,目的在于发现、定位应用性能瓶颈与故障,以保证应用达到目标服务水平并最终实现预期的用户体验。本专场将邀请来自国内APM领导品牌听云以及正在进行APM实践的腾讯与OPPO等企业的技术专家,一起分享不同领域关键业务在APM上的技术实践经验。

7月18日,星期六

  • 互联网金融

    从2013年互联网金融的“元年”开始,大家越来越感受到互联网金融巨大的影响力,作为一个把“钱”作为商品的行业,互联网金融如何来到你我的身边?欢迎参与本专题了解互联网金融生态下技术如何来玩“钱”。

  • 电商和零售业的转型

    互联网与传统行业结合最紧密的莫属零售或电商行业了。物流监控,采购与库存控制、促销与用户行为预测、个性化推荐以及所有这些要点背后的IT支持与数据分析。本专题将试图讨论电商行业的最佳实践。

  • 移动化机会

    移动化机会带来更多机会与挑战。轻或重,快或慢,自己造轮子或拿来主义?重平台还是重体验细节、重线上还是线下?传统与互联网聚集一堂,在这里你可以看到更多的激烈碰撞与思考,关于技术架构背后的故事与所做的艰难决定,在落地过程的得与失、总结与反思,希望留给架构师们一些启发和帮助。

  • 大数据背后的价值

    当数据不能产生价值时对企业就不是资产而是负担。本专题将分享企业在挖掘数据价值的成功经验,及其背后的技术、架构、工具,帮助企业找到最佳的大数据架构实现。

  • 企业云化的痛点与实践

    云计算作为IT的新常态, 已成为推动企业创新的主要技术动力。 企业走上云计算的道路应该从何做起, 如何克服遇到的困难?嘉宾将为您分享企业云之旅的最佳实践。

  • 数据分析与企业架构

    毫无疑问,我们正处在一个通过互联网来传输各种信息的大数据时代,这让人们的生活在逐渐“数据化”的同时,也变得更加便捷。然而这对于企业,尤其是IT企业内部的数据平台来说,却面临着更大的挑战,他们需要处理更多的研发数据、用户数据以及行业数据,需要在提升客户体验方面思考的更多。那么从企业架构的角度,又该如何考虑这些问题呢?本专题将主要围绕IT企业架构设计,以及软件研发体系等话题,探寻不同的IT公司是如何理解企业架构问题的,以及该如何构建适应自身发展的数据分析平台的。