O mnie
Jestem profesjonalistą IT z prawdziwą pasją do technologii i silną motywacją do rozwoju w tej dziedzinie. Ukończyłem Technikum Informatyczne i obecnie kontynuuję edukację w ATINS "Horyzont" we Wrocławiu. W swojej roli Specjalisty Business Intelligence w DXC Technology zapewniam kompleksowe wsparcie dla wielu platform BI, gwarantując płynne operacje i solidne zarządzanie danymi.
Moja praca obejmuje zarządzanie środowiskami serwerowymi, nadzorowanie procesów integracji danych oraz ułatwianie zadań administracyjnych platform. Wykorzystuję narzędzia takie jak REST API, Python i PowerShell do usprawniania przepływów pracy, wspierania krytycznego raportowania i implementowania aktualizacji oprogramowania. Dodatkowo opracowuję raporty Microsoft Power BI do celów wewnętrznych i administracyjnych, zapewniając skuteczną wizualizację danych i dostępność dla podejmowania decyzji.
Rozwijam się poprzez rozwiązywanie wyzwań, rozwiązywanie złożonych problemów i ciągłe uczenie się nowych rzeczy. Cenię jasną komunikację, pracę zespołową i nawiązywanie kontaktów z osobami, które dzielą mój entuzjazm dla innowacji IT.
O projekcie
YT Comment Analyzer to projekt stworzony wyłącznie w celach pracy inżynierskiej. Aplikacja służy do analizy komentarzy YouTube pod kątem wykrywania mowy nienawiści w języku polskim.
WAŻNE: Ten projekt nie jest przygotowany do użytku komercyjnego i został stworzony wyłącznie w celach edukacyjnych i badawczych jako część pracy dyplomowej.
Funkcjonalności:
- Pobieranie komentarzy z filmów YouTube
- Analiza komentarzy pod kątem mowy nienawiści
- Wizualizacja wyników analizy
- Zapisywanie i przeglądanie historii analiz
- System uwierzytelniania użytkowników
Licencje i wykorzystane zasoby
Model językowy HerBERT
Projekt wykorzystuje model językowy HerBERT - efektywnie wytrenowany model oparty na architekturze Transformer dla języka polskiego.
Autorzy: Robert Mroczkowski, Piotr Rybak, Alina Wróblewska, Ireneusz Gawlik
Źródło: arXiv:2105.01735v1
Repozytorium: GitHub:allegro/HerBERT
Licencja: Model dostępny na licencji MIT
Zbiór danych BAN-PL
Projekt wykorzystuje zbiór danych BAN-PL - nowy polski zbiór danych zawierający zakazaną szkodliwą i obraźliwą treść z serwisu Wykop.pl.
Autorzy: Anna Kołos, Inez Okulska, Kinga Głąbińska, Agnieszka Karlińska, Emilia Wiśnios, Paweł Ellerik, Andrzej Prałat
Źródło: arXiv:2308.10592
Repozytorium: GitHub: ZILiAT-NASK/BAN-PL
Licencja: CC-BY-4.0
Technologie i biblioteki
- FastAPI - nowoczesny framework web dla Pythona
- MongoDB - baza danych NoSQL
- Redis - baza danych w pamięci
- Docker - konteneryzacja aplikacji
- Nginx - serwer proxy i serwowania statycznych plików
- Transformers (Hugging Face) - biblioteka do modeli językowych
- PyTorch - framework do uczenia maszynowego
Dodatkowe zasoby
Projekt wykorzystuje również YouTube Data API v3 do pobierania komentarzy z platformy YouTube. Wszystkie wykorzystane zasoby są zgodne z ich odpowiednimi licencjami i warunkami użytkowania.
Zastrzeżenie prawne
Uwaga: Ten projekt został stworzony wyłącznie w celach edukacyjnych i badawczych jako część pracy inżynierskiej. Nie jest przeznaczony do użytku komercyjnego ani produkcyjnego.
Autor nie ponosi odpowiedzialności za jakiekolwiek szkody wynikłe z użycia tej aplikacji. Wszystkie wykorzystane modele, dane i technologie są własnością ich odpowiednich autorów i są wykorzystywane zgodnie z ich licencjami.