## [DataX-Example]调试datax插件的模块 ### 为什么要开发这个模块 一般使用DataX启动数据同步任务是从datax.py 脚本开始,获取程序datax包目录设置到系统变量datax.home里,此后系统核心插件的加载,配置初始化均依赖于变量datax.home,这带来了一些麻烦,以一次本地 DeBug streamreader 插件为例。 - maven 打包 datax 生成 datax 目录 - 在 IDE 中 设置系统环境变量 datax.home,或者在Engine启动类中硬编码设置datax.home。 - 修改插件 streamreader 代码 - 再次 maven 打包,使JarLoader 能够加载到最新的 streamreader 代码。 - 调试代码 在以上步骤中,打包完全不必要且最耗时,等待打包也最煎熬。 所以我编写一个新的模块(datax-example),此模块特用于本地调试和复现 BUG。如果模块顺利编写完成,那么以上流程将被简化至两步。 - 修改插件 streamreader 代码。 - 调试代码 img ### 实现原理 - 不修改原有的ConfigParer,使用新的ExampleConfigParser,仅用于example模块。他不依赖datax.home,而是依赖ide编译后的target目录 - 将ide的target目录作为每个插件的目录类加载目录。 ![img](img/img02.png) ### 如何使用 1.修改插件的pom文件,做如下改动。以streamreader为例。
改动前 ```xml maven-compiler-plugin ${jdk-version} ${jdk-version} ${project-sourceEncoding} ``` 改动后 ```xml src/main/resources **/*.* true maven-compiler-plugin ${jdk-version} ${jdk-version} ${project-sourceEncoding} ``` 2.在datax-example模块引入你需要的插件,默认只引入了streamreader、writer 3.打开datax-example的Main class ```java public class Main { /** * 注意! * 1.在example模块pom文件添加你依赖的的调试插件, * 你可以直接打开本模块的pom文件,参考是如何引入streamreader,streamwriter * 2. 在此处指定你的job文件 */ public static void main(String[] args) { String classPathJobPath = "/job/stream2stream.json"; String absJobPath = PathUtil.getAbsolutePathFromClassPath(classPathJobPath); startExample(absJobPath); } public static void startExample(String jobPath) { Configuration configuration = ExampleConfigParser.parse(jobPath); Engine engine = new Engine(); engine.start(configuration); } } ```