数据处理

关系型数据库表结构的两个设计技巧

创业小白 发布于 2016-10-03

关系型数据库表结构的设计,有下面两个设计技巧: 物理主键作为关联的外键 关系型数据库,由多个数据表构成。每一个数据表的结构是相同的,不同表之间可能存在关联关系。表之间的关联关系,正是关系型数据库得名的原因。 一个表由多个字段构成。其中可能有多个字段适合作为主键。主键字段,就是表中...

Spark SQL 究竟是何方神圣?

1

创业小白 发布于 2016-06-20

Spark SQL属于Spark用于处理结构化与半结构化数据的接口。结构化数据是指那些拥有一定模式的数据,包括JSON、Hive Tables以及Parquet。模式意味着每条记录都拥有一套已知字段组。半结构化数据则代表着模式与数据之间不存在明确的区分。 Spark SQL允许大...

大咖背后的技术力量:Airbnb的基础数据架构

1

创业小白 发布于 2016-02-28

这第一篇关于 Airbnb。云计算尤其亚马逊的云服务(AWS)提供弹性计算能力,无需购买昂贵服务器甚至机房,通过虚拟化主机,还提供丰富配套组件,节约运维成本,方便扩展,成为很多创业公司的首选。这里 Airbnb 工程师 James Mayfield 以 AWS 作为基础搭建数据架...

大数据科学:这些数据科学技能,才是老板们最想要的

1

创业小白 发布于 2016-02-24

这是一个好消息,如果你希望在2016年找一份数据科学的工作—在该领域职位空缺的数量正在不断增加,企业希望利用大数据来获得竞争优势。但事实上,找一份梦寐以求的数据科学工作就意味着你要具备一些技能的组合,你可能会惊讶学习哪些技能是雇主所最需要的。 最近,人们在CrowdFlower上...