New offer - be the first one to apply!
December 17, 2025
Mid • Remote
$100 - $130/
Warsaw, Poland
Pentacomp to firma z ponad 30-letnim doświadczeniem na rynku IT. Tworzymy nowoczesne rozwiązania informatyczne oraz świadczymy profesjonalne usługi dla dużych przedsiębiorstw i sektora publicznego. Łączymy innowacyjność z praktyczną wiedzą, zdobywaną podczas realizacji wielu zaawansowanych projektów dla wymagających klientów.
Lumicode to spółka należąca do Grupy Pentacomp, wspierająca rozwój i realizację projektów IT.
Aktualnie poszukujemy osoby na stanowisko: Specjalista/ka Data Lake
Opis stanowiska
Poszukujemy doświadczonego specjaliste/specjalistke w zakresie projektowania, budowy i utrzymania rozwiązań klasy Data Lake oraz ETL/ELT, z ugruntowaną wiedzą w obszarze Data Governance, jakości danych i zarządzania metadanymi. Stanowisko łączy kompetencje techniczne z umiejętnością definiowania procesów zarządzania danymi na poziomie organizacyjnym.
Nasze wymagania
Data Lake & Data Warehouse:Projektowanie i implementacja architektury DL i DW.Integracja danych z wielu źródeł, w tym systemów HIS, ERP, CRM i źródeł zewnętrznych.
ETL / ELT:Tworzenie i optymalizacja procesów ETL/ELT w narzędziach takich jak Apache Airflow, Talend, Informatica, dbt, SSIS czy Azure Data Factory.Projektowanie pipeline’ów danych, automatyzacja i orkiestracja przetwarzania dużych wolumenów danych.
Data Governance:Wdrażanie zasad zarządzania danymi (data ownership, data stewardship, lineage, katalogi danych).Znajomość narzędzi klasy Data Catalog / Data Quality.Definiowanie polityk zgodności z RODO, ISO 27001, DAMA-DMBOK.
Data Quality & Metadata Management:Opracowanie i utrzymanie reguł jakości danych, monitorowanie anomalii.Zarządzanie metadanymi technicznymi i biznesowymi.
Programowanie i integracja danych:Doświadczenie w SQL, Spark, Python i innych.Znajomość architektury REST API i SOAP.
Architektura danych:Projektowanie modeli danych (relacyjnych, semantycznych i big data).
Bazy Danych:Bazy danych SQL, No-SQL, Wektorowe.
Wykształcenie :Wyższe z zakresu IT / Analityki Danych / Statystyki / Matematyki Stosowanej
Technologie i narzędzia
ETL/Orkiestracja: Apache Airflow, Talend itp..
Big Data: Hadoop, Spark, Kafka itp..
Data Governance: Apache Atlas itp..
Języki: SQL, Python, Java itp..
CI/CD: Jenkins, Bitbucket
Mile widziane
Doświadczenie projektach z zakresu zdrowia i e-zdrowia
Certyfikacja big data / analityka danych
Znajomość UML/BPMN
Doświadczenie w projektach Scrum