DataX是阿里云DataWorks数据集成的开源版本。
Go to file
jiafeng.zhang 1b3eb9c016 fix
2022-11-15 14:32:57 +08:00
adbpgwriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
adswriter Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
cassandrareader Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
cassandrawriter Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
clickhousewriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
common DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
core 修改demo任务并发度为1,不开启限速 2022-10-11 11:26:06 +08:00
datahubreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
datahubwriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
doriswriter fix 2022-11-15 14:32:57 +08:00
drdsreader DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
drdswriter https://github.com/alibaba/DataX/issues/390 2021-01-08 14:58:53 +08:00
elasticsearchwriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
ftpreader Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
ftpwriter Update ftpwriter.md 2020-05-13 17:55:16 +08:00
gdbreader gdbreader: reader for Aliyun GDB 2020-04-13 10:29:33 +08:00
gdbwriter gdbwriter: update column index prefix 2020-08-12 15:18:33 +08:00
hbase11xreader Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
hbase11xsqlreader DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
hbase11xsqlwriter Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
hbase11xwriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
hbase20xsqlreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
hbase20xsqlwriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
hbase094xreader Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
hbase094xwriter Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
hdfsreader DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
hdfswriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
hologresjdbcwriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
images add new datax logo 2022-06-20 15:15:03 +08:00
kingbaseesreader Add kingbasees plug-in. 2020-09-17 15:14:45 +08:00
kingbaseeswriter Add kingbasees plug-in. 2020-09-17 15:14:45 +08:00
kuduwriter Merge pull request #858 from alibaba/dependabot/maven/junit-junit-4.13.1 2021-01-19 22:13:24 +08:00
loghubreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
loghubwriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
mongodbreader DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
mongodbwriter Merge branch 'master' into master 2022-06-10 19:01:24 +08:00
mysqlreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
mysqlwriter https://github.com/alibaba/DataX/issues/390 2021-01-08 14:58:53 +08:00
oceanbasev10reader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
oceanbasev10writer DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
ocswriter Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
odpsreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
odpswriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
opentsdbreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
oraclereader Update oracle driver GAV 2022-10-11 11:27:59 +08:00
oraclewriter Update oracle driver GAV 2022-10-11 11:27:59 +08:00
oscarwriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
ossreader DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
osswriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
otsreader DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
otsstreamreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
otswriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
plugin-rdbms-util DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
plugin-unstructured-storage-util DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
postgresqlreader DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
postgresqlwriter DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
rdbmsreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
rdbmswriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
rpm v0.0 2018-01-31 16:24:49 +08:00
sqlserverreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
sqlserverwriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
starrocksreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
starrockswriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
streamreader Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
streamwriter Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
tdenginereader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
tdenginewriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
transformer 补充mongodbreader文档,修正部分文档错误。 2020-07-03 14:47:28 +08:00
tsdbreader DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
tsdbwriter DataX 2209, add plugin: datahubreader/datahubwriter/loghubreader/loghubwriter/starrocksreader, update plugin: odpsreader/oceanbasev10reader/oceanbasev10writer/elasticserachwriter/mysqlreader/mysqlwriter 2022-09-30 11:47:43 +08:00
txtfilereader Bump jdk to 1.8 2019-11-08 15:08:16 +08:00
txtfilewriter Update txtfilewriter.md 2020-06-19 15:24:24 +08:00
.gitignore Add OpenTSDB reader and TSDB writer 2019-04-26 14:53:55 +08:00
datax-opensource-dingding.png v0.0 2018-01-31 16:24:49 +08:00
dataxPluginDev.md Merge pull request #626 from sqdf1990/modify_dataxPluginDev_md 2020-08-05 16:59:35 +08:00
introduction.md DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
license.txt DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
NOTICE DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00
package.xml Merge pull request #1280 from hf200012/doriswriter-1 2022-10-11 11:01:30 +08:00
pom.xml Update pom.xml 2022-10-11 11:10:38 +08:00
README.md add more plugin doc link 2022-10-11 11:31:25 +08:00
userGuid.md DataX 通道能力更新(MaxCompute、Hologres、Tdengine、OSS)、安全漏洞更新、通用打包更新等 2022-06-09 21:13:49 +08:00

Datax-logo

DataX

DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS 等各种异构数据源之间高效的数据同步功能。

DataX 商业版本

阿里云DataWorks数据集成是DataX团队在阿里云上的商业化产品致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动能力以及繁杂业务背景下的数据同步解决方案。目前已经支持云上近3000家客户单日同步数据超过3万亿条。DataWorks数据集成目前支持离线50+种数据源可以进行整库迁移、批量上云、增量同步、分库分表等各类同步解决方案。2020年更新实时同步能力2020年更新实时同步能力支持10+种数据源的读写任意组合。提供MySQLOracle等多种数据源到阿里云MaxComputeHologres等大数据引擎的一键全增量同步解决方案。

商业版本参见: https://www.aliyun.com/product/bigdata/ide

Features

DataX本身作为数据同步框架将不同数据源的同步抽象为从源头数据源读取数据的Reader插件以及向目标端写入数据的Writer插件理论上DataX框架可以支持任意数据源类型的数据同步工作。同时DataX插件体系作为一套生态系统, 每接入一套新数据源该新加入的数据源即可实现和现有的数据源互通。

DataX详细介绍

请参考:DataX-Introduction

Quick Start

Download DataX下载地址
请点击:Quick Start

Support Data Channels

DataX目前已经有了比较全面的插件体系主流的RDBMS数据库、NOSQL、大数据计算系统都已经接入目前支持数据如下图详情请点击DataX数据源参考指南

类型 数据源 Reader(读) Writer(写) 文档
RDBMS 关系型数据库 MySQL
            Oracle         √         √    
            OceanBase       √         √    
SQLServer
PostgreSQL
DRDS
Apache Doris
StarRocks
通用RDBMS(支持所有关系型数据库)
阿里云数仓数据存储 ODPS
ADS
OSS
OCS
NoSQL数据存储 OTS
Hbase0.94
Hbase1.1
Phoenix4.x
Phoenix5.x
MongoDB
Hive
Cassandra
无结构化数据存储 TxtFile
FTP
HDFS
Elasticsearch
时间序列数据库 OpenTSDB
TSDB
TDengine

阿里云DataWorks数据集成

目前DataX的已有能力已经全部融和进阿里云的数据集成并且比DataX更加高效、安全同时数据集成具备DataX不具备的其它高级特性和功能。可以理解为数据集成是DataX的全面升级的商业化用版本为企业可以提供稳定、可靠、安全的数据传输服务。与DataX相比数据集成主要有以下几大突出特点

支持实时同步:

离线同步数据源种类大幅度扩充:

我要开发新的插件

请点击:DataX插件开发宝典

重要版本更新说明

DataX 后续计划月度迭代更新,也欢迎感兴趣的同学提交 Pull requests月度更新内容会介绍介绍如下。

项目成员

核心Contributions: 言柏 、枕水、秋奇、青砾、一斅、云时

感谢天烬、光戈、祁然、巴真、静行对DataX做出的贡献。

License

This software is free to use under the Apache License Apache license.

请及时提出issue给我们。请前往DataxIssue

开源版DataX企业用户

Datax-logo

长期招聘 联系邮箱datax@alibabacloud.com
【JAVA开发职位】
职位名称JAVA资深开发工程师/专家/高级专家
工作年限 : 2年以上
学历要求 : 本科(如果能力靠谱,这些都不是条件)
期望层级 : P6/P7/P8

岗位描述:
    1. 负责阿里云大数据平台(数加)的开发设计。 
    2. 负责面向政企客户的大数据相关产品开发;
    3. 利用大规模机器学习算法挖掘数据之间的联系,探索数据挖掘技术在实际场景中的产品应用 
    4. 一站式大数据开发平台
    5. 大数据任务调度引擎
    6. 任务执行引擎
    7. 任务监控告警
    8. 海量异构数据同步

岗位要求:
    1. 拥有3年以上JAVA Web开发经验
    2. 熟悉Java的基础技术体系。包括JVM、类装载、线程、并发、IO资源管理、网络
    3. 熟练使用常用Java技术框架、对新技术框架有敏锐感知能力深刻理解面向对象、设计原则、封装抽象
    4. 熟悉HTML/HTML5和JavaScript熟悉SQL语言
    5. 执行力强,具有优秀的团队合作精神、敬业精神;
    6. 深刻理解设计模式及应用场景者加分;
    7. 具有较强的问题分析和处理能力、比较强的动手能力,对技术有强烈追求者优先考虑;
    8. 对高并发、高稳定可用性、高性能、大数据处理有过实际项目及产品经验者优先考虑;
    9. 有大数据产品、云产品、中间件技术解决方案者优先考虑。

用户咨询支持:

钉钉群目前暂时受到了一些管控策略影响,建议大家有问题优先在这里提交问题 IssueDataX研发和社区会定期回答Issue中的问题知识库丰富后也能帮助到后来的使用者。