工具-连环夺宝

当前位置：连环夺宝» 开放共性工具» 数据分析工具

声明：本栏目意在向用户介绍部分与数据处理相关的工具，以方便用户借助这些工具处理从本网站获取的开放数据。所有工具的相关信息均来源于网络，连环夺宝的版权归原作者或者来源机构所有，如果有涉及任何连环夺宝的版权方面的问题，请及时与我们联系。

rapidminer

开发者：rapidminer公司

rapid miner是一个数据科学软件平台，为数据准备、机器学习、深度学习、文本挖掘和预测分析提供一种集成环境。它是领先的数据挖掘开源系统之一。该程序完全用java编程语言编写。该程序提供了一个选项，以便用户试用大量可任意嵌套的操作符，这些操作符在xml文件中有详细说明，可由rapid miner的图形用户界面来构建。

orange

开发者：卢布尔雅那大学

orange是一个开源数据可视化、机器学习和数据挖掘工具包。orange基于 python和c/c 开发，提供了一系列的数据探索、可视化、预处理以及建模组件，可用于探索性数据分析和交互式数据可视化。orange拥有漂亮直观的交互式用户界面，非常适合新手进行探索性数据分析和可视化展示；同时高级用户也可以将其作为python的一个编程模块进行数据操作和组件开发。

weka

开发者：新西兰怀卡托大学

怀卡托知识分析环境(weka)是新西兰怀卡托大学开发的一套机器学习软件。该软件用java编写。它含有一系列面向数据分析和预测建模的可视化工具和算法，附带图形用户界面。weka支持几种标准数据挖掘任务，更具体地说是指数据预处理、聚类、分类、回归、可视化和特征选择。

r-programming

开发者：奥克兰大学

r-programming的简称r，被广泛应用于数据挖掘、开发统计软件以及数据分析中。作为一款针对编程语言和软件环境进行统计计算和制图的免费软件，它主要是由c语言和fortran语言编写的，并且很多模块都是由r编写的，具有出色的易用性和可扩展性，提供统计和制图技术，包括线性和非线性建模，经典的统计测试，时间序列分析、分类、收集等。

nltk

开发者：由steven bird和edward loper在宾夕法尼亚大学计算机和信息科学系开发

著名的开源数据挖掘工具——nltk，提供了一个语言处理工具，包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务，具有高智能性。另外，它是用python语言编写的，用户可以直接在上面建立应用，还可以自定义小任务，十分便捷。

spark

开发者：apache软件基金会, 加州大学柏克莱分校amplab, databricks

apache spark是一个开源簇运算框架，最初是由加州大学柏克莱分校amplab所开发。相对于hadoop的mapreduce会在运行完工作后将中介数据存放到磁盘中，spark使用了存储器内运算技术，能在数据尚未写入硬盘时即在存储器内分析运算。spark在存储器内运行程序的运算速度能做到比hadoop mapreduce的运算速度快上100倍，即便是运行程序于硬盘时，spark也能快上10倍速度。spark允许用户将数据加载至簇存储器，并多次对其进行查询，非常适合用于机器学习算法。

storm

开发者：backtype, twitter

storm是一个分布式计算框架，主要由clojure编程语言编写。最初是由nathan marz及其团队创建于backtype，该项目在被twitter取得后开源。它使用用户创建的“管（spouts）”和“螺栓（bolts）”来定义信息源和操作来允许批量、分布式处理流式数据。

spss

开发者：ibm公司

spss是统计产品与服务连环夺宝的解决方案（statistical product and service solutions）的简称，为ibm公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称，有windows和mac os x等版本。

共8条，分1页，当前第1页

	关于连环夺宝
	法律声明
	网站地图
	联系连环夺宝

	按主题
	按机构
	企业数据开放专栏
	区级单位
	历史数据
	开放目录
	有条件开放

	示例代码
	类参考
	常见问题

工具-连环夺宝

当前位置： 连环夺宝» 开放共性工具» 数据分析工具

当前位置：连环夺宝» 开放共性工具» 数据分析工具