查看: 734|回复: 0

[推荐] 程序员必备的九个大数据处理语言1

[复制链接]

54

主题

79

帖子

735

积分

Kib

Rank: 3Rank: 3

贡献
0
技术
0
活跃
20
在线时间
10 小时
发表于 2016-11-17 14:54:00 | 显示全部楼层 |阅读模式
  互联网发展迅速,编程语言更迭出新,但是作为一个优秀的编程人员,有九个大数据处理编程语言你不得不知道,当需要对巨大的数据集中进行筛选时,程序员们要知道最好的工具是什么,下面小编把动力节点金牌Java老师讲的宝典偷来给大家分享一下。
  1.R语言
  在语言名单中,如果R语言排第二,那就没其他能排第一。自1997年以来,作为昂贵的统计软件,如MatlabSAS的免费替代品,它渐渐风靡全球。
  在过去的几年时间中,R语言已经成为了数据科学的宠儿——数据科学现在不仅仅在统计学家中人尽皆知,而且也为华尔街交易员、生物学家、硅谷开发者所家喻户晓。各行各业,如GoogleFacebook,美国银行,以及纽约时报都使用R语言,R语言正在商业用途上持续蔓延和扩散。
  话说回来,早在2010年,PaulButler就以R语言打造了全球的Facebook地图而著名,这证明了该语言丰富的可视化功能。尽管他现在已经不像以前那样频繁地使用R语言了。“R正在一点点地过时,因为它的缓慢和处理大型数据集的笨重。”Butler说。那么,他使用什么代替呢?
  2.python
  如果说R语言是一个神经质又可爱的高手,那么Python是它随和又灵活的表兄弟。作为一种结合了R语言快速对复杂数据进行挖掘并构建产品的更实用语言,Python迅速得到了主流的吸引力。Python是直观的,并且比R语言更易于学习,以及它的生态系统近年来急剧增长,使得它更能够用于先前为R语言保留的统计分析。“这是这个行业的进步。在过去的两年时间中,从R语言到Python已经发生了非常明显的转变。”Butler说。
  在数据处理中,在规模和复杂性之间往往会有一个权衡,于是Python成为了一种折中方案。IPythonnotebookNumPy可以用作轻便工作的一种暂存器,而Python可以作为中等规模数据处理的强大工具。丰富的数据社区,也是Python的优势,因为可以提供了大量的工具包和功能。美国银行使用Python在银行的基础架构中构建新的产品和接口,同时也用Python处理财务数据。“Python广泛而灵活,因此人们趋之若鹜。”ODonnell说。不过,它并非最高性能的语言,只能偶尔用于大规模的核心基础设施。
  3.Julia
  虽然当前的数据科学绝大多数是通过R语言、PythonJavaMatLabSAS执行的,但依然有其他的语言存活于夹缝中,Julia就是其中的后起之秀。
  业界普遍认为Julia过于晦涩难懂,但在谈到它取代RPython的潜力时会不由得眉飞色舞。Julia是一种高层次的、极度快速的表达性语言。它比R语言快,比Python更可扩展,且相当简单易学。
  “它正在一步步成长。最终,使用Julia,你就能够办到任何用RPython可以做到的事情。”Butler说。但是至今为止,年轻人对Julia依然犹豫不前。Julia数据社区还处于早期阶段,想要和R语言和Python竞争,它还需要添加更多的软件包和工具。“它还很年轻,但它正在掀起浪潮并且非常有前途。”Driscoll说。
  4.Java
  Java,以及基于Java的框架,被发现俨然成为了硅谷最大的那些高科技公司的骨骼支架。“如果你去看TwitterLinkedInFacebook,那么你会发现,Java是它们所有数据工程基础设施的基础语言。”Driscoll说。
  虽然,Java不能提供RPython同样质量的可视化,并且它并非统计建模的最佳选择,但是,如果你移动到过去的原型制作并需要建立大型系统,那么Java往往是你的最佳选择。
  

使用 高级模式(可批量传图、插入视频等)
您需要登录后才可以回帖 登录 | 立即注册

快速回复 返回顶部 返回列表