DataX是阿里云DataWorks数据集成的开源版本。
Go to file
2018-02-02 17:57:27 +08:00
adswriter v0.0 2018-01-31 16:24:49 +08:00
common v0.0 2018-01-31 16:24:49 +08:00
core v0.0 2018-01-31 16:24:49 +08:00
drdsreader v0.0 2018-01-31 16:24:49 +08:00
drdswriter v0.0 2018-01-31 16:24:49 +08:00
elasticsearchwriter v0.0 2018-01-31 16:24:49 +08:00
ftpreader v0.0 2018-01-31 16:24:49 +08:00
ftpwriter v0.0 2018-01-31 16:24:49 +08:00
hbase11xreader v0.0 2018-01-31 16:24:49 +08:00
hbase11xsqlwriter v0.0 2018-01-31 16:24:49 +08:00
hbase11xwriter v0.0 2018-01-31 16:24:49 +08:00
hbase094xreader v0.0 2018-01-31 16:24:49 +08:00
hbase094xwriter v0.0 2018-01-31 16:24:49 +08:00
hdfsreader v0.0 2018-01-31 16:24:49 +08:00
hdfswriter v0.0 2018-01-31 16:24:49 +08:00
images v0.0 2018-01-31 16:24:49 +08:00
mongodbreader v0.0 2018-01-31 16:24:49 +08:00
mongodbwriter v0.0 2018-01-31 16:24:49 +08:00
mysqlreader v0.0 2018-01-31 16:24:49 +08:00
mysqlwriter v0.0 2018-01-31 16:24:49 +08:00
ocswriter v0.0 2018-01-31 16:24:49 +08:00
odpsreader v0.0 2018-01-31 16:24:49 +08:00
odpswriter v0.0 2018-01-31 16:24:49 +08:00
oraclereader v0.0 2018-01-31 16:24:49 +08:00
oraclewriter v0.0 2018-01-31 16:24:49 +08:00
ossreader v0.0 2018-01-31 16:24:49 +08:00
osswriter v0.0 2018-01-31 16:24:49 +08:00
otsreader v0.0 2018-01-31 16:24:49 +08:00
otsstreamreader v0.0 2018-01-31 16:24:49 +08:00
otswriter v0.0 2018-01-31 16:24:49 +08:00
plugin-rdbms-util v0.0 2018-01-31 16:24:49 +08:00
plugin-unstructured-storage-util v0.0 2018-01-31 16:24:49 +08:00
postgresqlreader v0.0 2018-01-31 16:24:49 +08:00
postgresqlwriter v0.0 2018-01-31 16:24:49 +08:00
rdbmsreader v0.0 2018-01-31 16:24:49 +08:00
rdbmswriter v0.0 2018-01-31 16:24:49 +08:00
rpm v0.0 2018-01-31 16:24:49 +08:00
sqlserverreader v0.0 2018-01-31 16:24:49 +08:00
sqlserverwriter v0.0 2018-01-31 16:24:49 +08:00
streamreader v0.0 2018-01-31 16:24:49 +08:00
streamwriter v0.0 2018-01-31 16:24:49 +08:00
transformer v0.0 2018-01-31 16:24:49 +08:00
txtfilereader v0.0 2018-01-31 16:24:49 +08:00
txtfilewriter v0.0 2018-01-31 16:24:49 +08:00
datax-opensource-dingding.png v0.0 2018-01-31 16:24:49 +08:00
introduction.md fix doc 2018-02-02 17:53:00 +08:00
license.txt v0.0 2018-01-31 16:24:49 +08:00
package.xml fix doc 2018-02-02 17:53:00 +08:00
pom.xml fix doc 2018-02-02 17:53:00 +08:00
README v0.0 2018-01-31 16:24:49 +08:00
README.md fix doc 2018-02-02 17:53:00 +08:00
userGuid.md v0.0 2018-01-31 16:24:49 +08:00

Datax-logo

DataX

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。

Features

DataX本身作为数据同步框架将不同数据源的同步抽象为从源头数据源读取数据的Reader插件以及向目标端写入数据的Writer插件理论上DataX框架可以支持任意数据源类型的数据同步工作。同时DataX插件体系作为一套生态系统, 每接入一套新数据源该新加入的数据源即可实现和现有的数据源互通。

DataX详细介绍

请参考:DataX-Introduction

Quick Start

Download DataX下载地址
请点击:Quick Start

Support Data Channels

DataX目前已经有了比较全面的插件体系主流的RDBMS数据库、NOSQL、大数据计算系统都已经接入目前支持数据如下图详情请点击DataX数据源参考指南

类型 数据源 Reader(读) Writer(写) 文档
RDBMS 关系型数据库 MySQL 读写
Oracle 读写
SQLServer 读写
PostgreSQL 读写
DRDS 读写
达梦 读写
通用RDBMS(支持所有关系型数据库) 读写
阿里云数仓数据存储 ODPS 读写
ADS 读写
OSS 读写
OCS 读写
NoSQL数据存储 OTS 读写
Hbase0.94 读写
Hbase1.1 读写
MongoDB 读写
无结构化数据存储 TxtFile 读写
FTP 读写
HDFS 读写
Elasticsearch 读写

我要开发新的插件

请点击:DataX插件开发宝典

项目成员

核心Contributions: 光戈、一斅、祁然、云时

感谢天烬、巴真、静行对DataX做出的贡献。

License

This software is free to use under the Apache License Apache license.

请及时提出issue给我们。请前往DataxIssue

开源版DataX企业用户

Datax-logo

长期招聘 联系邮箱hanfa.shf@alibaba-inc.com
【JAVA开发职位】
职位名称JAVA资深开发工程师/专家/高级专家
工作年限 : 2年以上
学历要求 : 本科(如果能力靠谱,这些都不是条件)
期望层级 : P6/P7/P8

岗位描述:
    1. 负责阿里云大数据平台(数加)的开发设计。 
    2. 负责面向政企客户的大数据相关产品开发;
    3. 利用大规模机器学习算法挖掘数据之间的联系,探索数据挖掘技术在实际场景中的产品应用 
    4. 一站式大数据开发平台
    5. 大数据任务调度引擎
    6. 任务执行引擎
    7. 任务监控告警
    8. 海量异构数据同步

岗位要求:
    1. 拥有3年以上JAVA Web开发经验
    2. 熟悉Java的基础技术体系。包括JVM、类装载、线程、并发、IO资源管理、网络
    3. 熟练使用常用Java技术框架、对新技术框架有敏锐感知能力深刻理解面向对象、设计原则、封装抽象
    4. 熟悉HTML/HTML5和JavaScript熟悉SQL语言
    5. 执行力强,具有优秀的团队合作精神、敬业精神;
    6. 深刻理解设计模式及应用场景者加分;
    7. 具有较强的问题分析和处理能力、比较强的动手能力,对技术有强烈追求者优先考虑;
    8. 对高并发、高稳定可用性、高性能、大数据处理有过实际项目及产品经验者优先考虑;
    9. 有大数据产品、云产品、中间件技术解决方案者优先考虑。

钉钉用户请扫描以下二维码进行讨论:

DataX-OpenSource-Dingding