New offer - be the first one to apply!

December 17, 2025

Specjalista/ka Data Lake

Mid • Remote

$100 - $130/

Warsaw, Poland

Pentacomp to firma z ponad 30-letnim doświadczeniem na rynku IT. Tworzymy nowoczesne rozwiązania informatyczne oraz świadczymy profesjonalne usługi dla dużych przedsiębiorstw i sektora publicznego. Łączymy innowacyjność z praktyczną wiedzą, zdobywaną podczas realizacji wielu zaawansowanych projektów dla wymagających klientów.

Lumicode to spółka należąca do Grupy Pentacomp, wspierająca rozwój i realizację projektów IT.

Aktualnie poszukujemy osoby na stanowisko: Specjalista/ka Data Lake


Opis stanowiska

Poszukujemy doświadczonego specjaliste/specjalistke w zakresie projektowania, budowy i utrzymania rozwiązań klasy Data Lake oraz ETL/ELT, z ugruntowaną wiedzą w obszarze Data Governance, jakości danych i zarządzania metadanymi. Stanowisko łączy kompetencje techniczne z umiejętnością definiowania procesów zarządzania danymi na poziomie organizacyjnym.


Nasze wymagania

  • Data Lake & Data Warehouse:Projektowanie i implementacja architektury DL i DW.Integracja danych z wielu źródeł, w tym systemów HIS, ERP, CRM i źródeł zewnętrznych.

  • ETL / ELT:Tworzenie i optymalizacja procesów ETL/ELT w narzędziach takich jak Apache Airflow, Talend, Informatica, dbt, SSIS czy Azure Data Factory.Projektowanie pipeline’ów danych, automatyzacja i orkiestracja przetwarzania dużych wolumenów danych.

  • Data Governance:Wdrażanie zasad zarządzania danymi (data ownership, data stewardship, lineage, katalogi danych).Znajomość narzędzi klasy Data Catalog / Data Quality.Definiowanie polityk zgodności z RODO, ISO 27001, DAMA-DMBOK.

  • Data Quality & Metadata Management:Opracowanie i utrzymanie reguł jakości danych, monitorowanie anomalii.Zarządzanie metadanymi technicznymi i biznesowymi.

  • Programowanie i integracja danych:Doświadczenie w SQL, Spark, Python i innych.Znajomość architektury REST API i SOAP.

  • Architektura danych:Projektowanie modeli danych (relacyjnych, semantycznych i big data).

  • Bazy Danych:Bazy danych SQL, No-SQL, Wektorowe.

  • Wykształcenie :Wyższe z zakresu IT / Analityki Danych / Statystyki / Matematyki Stosowanej

Technologie i narzędzia

  • ETL/Orkiestracja: Apache Airflow, Talend itp..

  • Big Data: Hadoop, Spark, Kafka itp..

  • Data Governance: Apache Atlas itp..

  • Języki: SQL, Python, Java itp..

  • CI/CD: Jenkins, Bitbucket

Mile widziane

  • Doświadczenie projektach z zakresu zdrowia i e-zdrowia

  • Certyfikacja big data / analityka danych

  • Znajomość UML/BPMN

  • Doświadczenie w projektach Scrum