Cơ BảnKafka iconKafka

Kafka Connect là gì? Nó giải quyết bài toán gì trong data pipeline?

Kafka Connect là framework tích hợp sẵn trong Kafka ecosystem để kết nối Kafka với các external system (database, file system, cloud storage, search engine) mà không cần viết code.

  • Kafka Connect có hai loại connector: Source Connector (đọc data từ external system vào Kafka, ví dụ: Debezium CDC từ PostgreSQL) và Sink Connector (ghi data từ Kafka ra external system, ví dụ: Elasticsearch Sink).
  • Connect chạy ở chế độ distributed với worker pool, tự động handle fault tolerance và load balancing.

Ví dụ thực tế: dùng Debezium Source Connector để capture mọi thay đổi trong MySQL database, publish vào Kafka topic, sau đó Elasticsearch Sink Connector index data để search — toàn bộ pipeline không cần viết một dòng code custom nào.

Xem toàn bộ Kafka cùng filter theo level & chủ đề con.

Mở danh sách Kafka