O mnie

O mnie

Jestem profesjonalistą IT z prawdziwą pasją do technologii i silną motywacją do rozwoju w tej dziedzinie. Ukończyłem Technikum Informatyczne i obecnie kontynuuję edukację w ATINS "Horyzont" we Wrocławiu. W swojej roli Specjalisty Business Intelligence w DXC Technology zapewniam kompleksowe wsparcie dla wielu platform BI, gwarantując płynne operacje i solidne zarządzanie danymi.

Moja praca obejmuje zarządzanie środowiskami serwerowymi, nadzorowanie procesów integracji danych oraz ułatwianie zadań administracyjnych platform. Wykorzystuję narzędzia takie jak REST API, Python i PowerShell do usprawniania przepływów pracy, wspierania krytycznego raportowania i implementowania aktualizacji oprogramowania. Dodatkowo opracowuję raporty Microsoft Power BI do celów wewnętrznych i administracyjnych, zapewniając skuteczną wizualizację danych i dostępność dla podejmowania decyzji.

Rozwijam się poprzez rozwiązywanie wyzwań, rozwiązywanie złożonych problemów i ciągłe uczenie się nowych rzeczy. Cenię jasną komunikację, pracę zespołową i nawiązywanie kontaktów z osobami, które dzielą mój entuzjazm dla innowacji IT.

O projekcie

YT Comment Analyzer to projekt stworzony wyłącznie w celach pracy inżynierskiej. Aplikacja służy do analizy komentarzy YouTube pod kątem wykrywania mowy nienawiści w języku polskim.

WAŻNE: Ten projekt nie jest przygotowany do użytku komercyjnego i został stworzony wyłącznie w celach edukacyjnych i badawczych jako część pracy dyplomowej.

Funkcjonalności:

  • Pobieranie komentarzy z filmów YouTube
  • Analiza komentarzy pod kątem mowy nienawiści
  • Wizualizacja wyników analizy
  • Zapisywanie i przeglądanie historii analiz
  • System uwierzytelniania użytkowników

Licencje i wykorzystane zasoby

Model językowy HerBERT

Projekt wykorzystuje model językowy HerBERT - efektywnie wytrenowany model oparty na architekturze Transformer dla języka polskiego.

Autorzy: Robert Mroczkowski, Piotr Rybak, Alina Wróblewska, Ireneusz Gawlik

Źródło: arXiv:2105.01735v1

Repozytorium: GitHub:allegro/HerBERT

Licencja: Model dostępny na licencji MIT

Zbiór danych BAN-PL

Projekt wykorzystuje zbiór danych BAN-PL - nowy polski zbiór danych zawierający zakazaną szkodliwą i obraźliwą treść z serwisu Wykop.pl.

Autorzy: Anna Kołos, Inez Okulska, Kinga Głąbińska, Agnieszka Karlińska, Emilia Wiśnios, Paweł Ellerik, Andrzej Prałat

Źródło: arXiv:2308.10592

Repozytorium: GitHub: ZILiAT-NASK/BAN-PL

Licencja: CC-BY-4.0

Technologie i biblioteki

  • FastAPI - nowoczesny framework web dla Pythona
  • MongoDB - baza danych NoSQL
  • Redis - baza danych w pamięci
  • Docker - konteneryzacja aplikacji
  • Nginx - serwer proxy i serwowania statycznych plików
  • Transformers (Hugging Face) - biblioteka do modeli językowych
  • PyTorch - framework do uczenia maszynowego

Dodatkowe zasoby

Projekt wykorzystuje również YouTube Data API v3 do pobierania komentarzy z platformy YouTube. Wszystkie wykorzystane zasoby są zgodne z ich odpowiednimi licencjami i warunkami użytkowania.

Zastrzeżenie prawne

Uwaga: Ten projekt został stworzony wyłącznie w celach edukacyjnych i badawczych jako część pracy inżynierskiej. Nie jest przeznaczony do użytku komercyjnego ani produkcyjnego.

Autor nie ponosi odpowiedzialności za jakiekolwiek szkody wynikłe z użycia tej aplikacji. Wszystkie wykorzystane modele, dane i technologie są własnością ich odpowiednich autorów i są wykorzystywane zgodnie z ich licencjami.