LTS 轻量级分布式任务调度框架(Light Task Scheduler) ----------------- ###框架概况: LTS是一个轻量级分布式任务调度框架。有三种角色, JobClient, JobTracker, TaskTracker。各个节点都是无状态的,可以部署多个,来实现负载均衡,实现更大的负载量, 并且框架具有很好的容错能力。 采用多种注册中心(Zookeeper,redis等)进行节点信息暴露,master选举。(Mongo or Mysql)存储任务队列和任务执行日志, netty做底层通信。 * JobClient : 主要负责提交任务, 和 接收任务执行反馈结果。 * JobTracker : 负责接收并分配任务,任务调度。 * TaskTracker: 负责执行任务,执行完反馈给JobTracker。 支持任务类型: * 实时任务 * 也支持定时任务 (如:3天之后执行) * CronExpression (如:0 0/1 * * * ?) 感兴趣,请加QQ群:109500214 一起探讨、完善。越多人支持,就越有动力去更新,喜欢记得右上角star哈。 github地址:[https://github.com/ltsopensource/light-task-scheduler](https://github.com/ltsopensource/light-task-scheduler) ###架构图 ![Aaron Swartz](http://git.oschina.net/hugui/light-task-scheduler/raw/master/docs/LTS_architecture.png?dir=0&filepath=docs%2FLTS_architecture.png&oid=1e5daa62b8d032daaa47eab4a84ab1d4c8962c33&sha=774aa73d186470aedbb8f4da3c04a86a6022be05) ####节点组: * 1. 一个节点组等同于一个集群,同一个节点组中的各个节点是对等的,外界无论连接节点组中的任务一个节点都是可以的。 * 2. 每个节点组中都有一个master节点(master宕机,会自动选举出新的master节点),框架会提供接口API来监听master节点的变化,用户可以自己使用master节点做自己想做的事情。 * 3. JobClient和TaskTracker都可以存在多个节点组。譬如 JobClient 可以存在多个节点组。 譬如:JobClient 节点组为 ‘lts_WEB’ 中的一个节点提交提交一个 只有节点组为’lts_TRADE’的 TaskTracker 才能执行的任务。 * 4. (每个集群中)JobTacker只有一个节点组。 * 5. 多个JobClient节点组和多个TaskTracker节点组再加上一个JobTacker节点组, 组成一个大的集群。 ###工作流程: * 1. JobClient 提交一个 任务 给 JobTracker, 这里我提供了两种客户端API, 一种是如果JobTracker 不存在或者提交失败,直接返回提交失败。另一种客户端是重试客户端, 如果提交失败,先存储到本地FailStore(可以使用NFS来达到同个节点组共享leveldb文件的目的,多线程访问,已经做了文件锁处理),返回给客户端提交成功的信息,待JobTracker可用的时候,再将任务提交。 * 2. JobTracker收到JobClient提交来的任务,将任务存入任务队列。JobTracker等待TaskTracker的Pull请求,然后将任务Push给TaskTracker去执行。 * 3. TaskTracker收到JobTracker分发来的任务之后,然后从线程池中拿到一个线程去执行。执行完毕之后,再反馈任务执行结果给JobTracker(成功or 失败[失败有失败错误信息]),如果发现JobTacker不可用,那么存储本地FailStore,等待JobTracker可用的时候再反馈。反馈结果的同时,询问JobTacker有没有新的任务要执行。 * 4. JobTacker收到TaskTracker节点的任务结果信息。根据任务信息决定要不要反馈给客户端。不需要反馈的直接删除,需要反馈的,直接反馈,反馈失败进入FeedbackQueue, 等待重新反馈。 * 5. JobClient收到任务执行结果,进行自己想要的逻辑处理。 * 详细请查看 [流程图](http://git.oschina.net/hugui/light-task-scheduler/raw/master/docs/LTS_progress.png?dir=0&filepath=docs%2FLTS_progress.png&oid=22f60a83b51b26bac8dabbb5053ec9913cefc45c&sha=774aa73d186470aedbb8f4da3c04a86a6022be05) ###特性 * 负载均衡: * JobClient和TaskTracker可是根据自己设置的负载均衡策略来请求JobTracker节点组中的一个节点。当连接上后将一直保持连接这个节点,保持连接通道,直到这个节点不可用,减少每次都重新连接一个节点带来的性能开销。 * 健壮性: * 当节点组中的一个节点当机之后,自动转到其他节点工作。当整个节点组当机之后,将会采用存储文件的方式,待节点组可用的时候进行重发。 * 当执行任务的TaskTracker节点当机之后,JobTracker会将这个TaskTracker上的未完成的任务(死任务),重新分配给节点组中其他节点执行。 * 伸缩性: * 因为各个节点都是无状态的,可以动态增加机器部署实例, 节点关注者会自动发现。 * 扩展性: * 采用和dubbo一样的SPI扩展方式,可以实现任务队列扩展,日志记录器扩展等 ###日志记录 对于任务的分发,执行,还有用户通过 (BizLogger) 【JobContext#getBizLogger()】 输入的业务日志,LTS都有记录,用户可以在LTS Admin 后台界面查看某个任务的所有日志,可以实时查看这个任务的执行情况。 ###开发计划: * WEB后台管理:性能统计分析,预警等 * 实现LTS的分布式队列存储 ###LTS Admin 后台首页 [http://localhost:8081/main.html](http://localhost:8081/main.html) ![Aaron Swartz](http://git.oschina.net/hugui/light-task-scheduler/raw/master/docs/LTS_Admin.png?dir=0&filepath=docs%2FLTS_Admin.png&oid=a53f98823a0451a80a34467c7dfa2a01d568a9e2&sha=774aa73d186470aedbb8f4da3c04a86a6022be05) ###调用示例 下面提供的是最简单的配置方式。更多配置请查看 [lts-example](https://github.com/ltsopensource/light-task-scheduler/tree/master/lts-example/src/main/java/com/lts/example/api) 模块下的 API 调用方式例子. ####JobTracker 端 ```java final JobTracker jobTracker = new JobTracker(); // 节点信息配置 jobTracker.setRegistryAddress("zookeeper://127.0.0.1:2181"); // 1. 任务队列用mongo jobTracker.addConfig("job.queue", "mongo"); // mongo 配置 jobTracker.addConfig("mongo.addresses", "127.0.0.1:27017"); jobTracker.addConfig("mongo.database", "lts"); jobTracker.setOldDataHandler(new OldDataDeletePolicy()); // 启动节点 jobTracker.start(); ``` #### TaskTracker端 ```java TaskTracker taskTracker = new TaskTracker(); taskTracker.setJobRunnerClass(TestJobRunner.class); taskTracker.setRegistryAddress("zookeeper://127.0.0.1:2181"); taskTracker.setNodeGroup("test_trade_TaskTracker"); taskTracker.setWorkThreads(20); taskTracker.start(); // 任务执行类 public class TestJobRunner implements JobRunner { @Override public void run(Job job) throws Throwable { System.out.println("我要执行"+ job); System.out.println(job.getParam("shopId")); // TODO 用户自己的业务逻辑, 应该保证幂等 try { Thread.sleep(5*1000L); } catch (InterruptedException e) { e.printStackTrace(); } } } ``` #### JobClient端 ```java JobClient jobClient = new RetryJobClient(); // final JobClient jobClient = new JobClient(); jobClient.setNodeGroup("test_jobClient"); jobClient.setRegistryAddress("zookeeper://127.0.0.1:2181"); jobClient.start(); // 提交任务 Job job = new Job(); job.setTaskId("3213213123"); job.setParam("shopId", "11111"); job.setTaskTrackerNodeGroup("test_trade_TaskTracker"); // job.setCronExpression("0 0/1 * * * ?"); // 支持 cronExpression表达式 // job.setTriggerTime(new Date()); // 支持指定时间执行 Response response = jobClient.submitJob(job); ``` ##更新 1.5.5 1. 添加自动编译打包, LTS-Admin和JobTracker的shell脚本运行 1.5.4.1 * 增加TaskTracker的监控数据,LTS-admin可以查看 1.5.4: * 1. 增加 lts-spring 工程对spring的支持 (见lts-example 中spring文件夹下的例子) * 2. 对于TaskTracker 同时支持 JobRunner 中 注解注入bean 和xml注入的方式