Я пытаюсь сделать Sink для Flink, чтобы отправлять сообщения от Flink до RabbitMQ. Когда я создаю Sink в основном, все работает нормально - я получаю сообщение в специальной очереди на RabbitMQ. ...
Я использую аккумулятор в функции сгиба. Я хотел бы изменить значение аккумулятора. Моя функция выглядит примерно так: public Tuple2 < String, Long > раза (Tuple2 & л; String, ...
У меня есть кластер Apache Flink с автономным режимом, я хочу настроить Flink Metrics. Конфигурация в flink-conf.yaml metrics.reporter: my_jmx_reporter, my_other_reporter metrics.reporter ....
Я пытаюсь посчитать элементы в потоке, обогащая результат временем окончания окна. События получены от Kafka с использованием kafka10, предоставленного Flink. EventTime используется ....
При использовании Flink Table SQL в моем проекте я обнаружил, что если в моем SQL-запросе есть какое-либо предложение GROUP BY, размер контрольной точки значительно возрастет. Например, INSERT INTO COMPANY_POST_DAY SELECT ...
Я пытаюсь обработать некоторые файлы в HDFS и записать результаты обратно в HDFS. Файлы уже подготовлены до начала работы. Дело в том, что я хочу писать в разные пути и файлы на основе ...
Бэкэнд состояния RocksDB отсутствует: состояние широковещания сохраняется в памяти во время выполнения, и подготовка памяти должна выполняться соответствующим образом. Это верно для всех состояний операторов. выше с официального сайта Flink. ...
Я запускаю приложение Flink (через Yarn), и кажется, что иногда диспетчер задач иногда останавливается, вот ошибка: java.util.concurrent.TimeoutException: Heartbeat TaskManager с идентификатором ...
По этому ответу https://stackoverflow.com/a/1759565/11217621 я знаю, что в Java можно сделать что-то вроде открытого класса MyClass < S, T > {public void foo (Set < S > s, Set < T & ...
У меня вышел из строя DataStream < Event > что я хочу отсортировать так, чтобы события были упорядочены по их временным меткам. Я упростил свой вариант использования до того, что мой класс Event имеет только ...
Я работаю над проектом Flink, который записывает поток в реляционную базу данных. В текущем решении мы написали пользовательскую функцию приемника, которая открывает транзакцию, выполняет оператор вставки SQL и закрывает ...
Я наблюдаю, что наличие контрольных точек при использовании бэкэнда памяти вызывает неожиданное увеличение наблюдаемых задержек. Рассмотрим следующую контрольную точку: 2019-02-27 15: 35: 46,322 INFO org ....
У меня есть задание Flink, которое я тестирую интеграцией, используя описанный здесь подход: https://ci.apache.org/projects/flink/flink-docs-stable/dev/stream/testing.html#integration-testing. Задание занимает ...
Я хотел бы посоветовать вам быстрое возможное улучшение в DOC онлайн с сериализацией. На самом деле вы проделали потрясающую работу как над реализацией, так и над документацией. Путь ...
Я пишу приложение Flink на Kotlin, и классы данных (как и другие классы Kotlin) не определены как допустимые типы POJO. В документации Flink говорится, что тип данных распознается как ...
Apache Flink предоставляет множество различных потоковых источников, но мне было интересно, можно ли использовать консоль в качестве источника данных. Я не нашел ни одного примера в Интернете. Я придумал ...
У нас работает автономный кластер Flink с 2 менеджерами вакансий и 3 менеджерами задач. Всякий раз, когда происходит сбой ТМ, мы просто перезапускаем эту конкретную ТМ и продолжаем обработку. Но читая ...
У меня есть источник kafka, из которого мое приложение flink читает данные и обрабатывает их, я хочу добавить механизм сохранения точки flink, чтобы возобновить процесс с того места, где он был оставлен, а не ...
У меня есть конвейер данных 5 разных задач. если в какой-либо задаче есть какое-либо исключение, то перенесите его в тему ошибки kafka. есть ли обработчик исключений
У меня есть 4 менеджера задач и использующий бэкэнд состояния карты (RocksDB) используя QueryableStateClient для запроса состояния. 1. Как получить правильный диспетчер задач для запроса состояния вместо запроса всей задачи ...
Я успешно использовал JsonRowSerializationSchema из артефакта flink-json для создания TableSink < Row > и вывести JSON из SQL, используя ROW. Он отлично работает для передачи плоских данных: INSERT ...
В настоящее время я работаю над семестровым проектом, где я должен узнать серию из трех событий. Нравится P - > R - > P У нас есть два разных типа событий, которые потребляются через разъем Kafka в ...
Apache Flink позволяет мне использовать State в RichMapFunction. Я планирую создать постоянно работающую работу, которая анализирует поток веб-событий. Частью обработки будет создание ...
У нас есть работа с 30 операторами. Когда мы выполняем эту работу с параллелизмом в 12 шагов, в итоге получается 400 000 метрик, что слишком много для нашей метрической платформы. ...
Я выполняю задание Flink в кластере, содержащем 3 менеджера задач (поверх 3 модулей Kubernetes). Параллелизм задания по умолчанию равен 9, а один из операторов настроен на параллелизм 18. Номер задания ...