Rok akademicki 2025/2026
Semestr zimowy 2025/2026
Prowadzący seminarium (UR): dr hab. Agnieszka Nowak Brzezińska prof. UŚ, dr hab. Beata Zielosko prof. UŚ
Autor referatu: mgr Katarzyna Kusztal (kooperacja dr hab. Małgorzata Przybyła-Kasperek, prof. UŚ
Temat: metody klasyfikacji na podstawie danych rozproszonych
Streszczenie: Rozwój technologii i nieustanny przyrost informacji sprawiają, że coraz częściej mamy do czynienia z danymi rozproszonymi – gromadzonymi/generowanymi w sposób niezależny przez różne podmioty. Dane te, choć są fragmentaryczne i pochodzą z odrębnych źródeł, często odnoszą się do tego samego problemu decyzyjnego. Przykładem mogą być dane medyczne, zbierane w oddziałach szpitalnych w różnych miastach, czy informacje o klientach przechowywane przez regionalne oddziały jednej instytucji finansowej. Integracja takich danych i ich efektywne wykorzystanie w zadaniach klasyfikacyjnych stanowią istotne wyzwanie badawcze, które nie znajduje pełnego rozwiązania w istniejących metodach, takich jak zespoły klasyfikatorów czy uczenie federacyjne. W referacie przedstawione zostaną nowe podejścia do klasyfikacji danych rozproszonych, uwzględniające ich specyfikę oraz wynikające z niej ograniczenia. Kluczowa idea zakłada wykorzystanie analizy konfliktów do oceny podobieństw pomiędzy lokalnymi zbiorami danych, a następnie grupowanie zbliżonych jednostek w koalicje, w ramach których współpracują w procesie podejmowania decyzji. Wyniki badań wskazują, że taka forma kooperacji lokalnych źródeł sprzyja budowie modeli o wysokiej jakości predykcji. Ponadto, zastosowanie drzew i reguł decyzyjnych zapewnia interpretowalność procesu decyzyjnego.
Termin: 2026-03-10, godz. 13.00-13.45
Miejsce: Platforma Teams
*
Prowadzący seminarium (UR): dr hab. Urszula Bentkowska prof. UR, dr Anna Król
Autor referatu: mgr inż. Jarosław Szkoła (kooperacja dr hab. Barbara Pękala, prof. UR)
Temat: Metody agregacji w uczeniu federacyjnym na danych z niepewnością oparte na teorii przedziałowych zbiorów rozmytych
Streszczenie: Prezentacja dotyczy uczenia federacyjnego z zastosowaniem różnych metod agregacji danych i zagadnień z tym związanych. Między innymi badany jest wpływ niezbalansowania zbiorów danych na proces trenowania modeli jak również analizowane są przypadki braków danych w zbiorach treningowych w uczeniu federacyjnym.
Termin: 2025-11-18, godz. 13.00-13.45
Miejsce: Platforma Teams
*
Prowadzący seminarium (UŚ): dr hab. Agnieszka Nowak Brzezińska prof. UŚ, dr hab. Beata Zielosko prof. UŚ
Autor referatu: dr Katarzyna Miś
Temat: Rozmyte podsumowania lingwistyczne
Streszczenie: Rozmyte podsumowania lingwistyczne są zdaniami, które w języku naturalnym pomagają w prosty sposób opisać duże zbiory danych. W podsumowaniach tych występują określenia wyrażone przy pomocy zbiorów rozmytych oraz kwantyfikatory lingwistyczne. W referacie skupimy się na tychże kwantyfikatorach, ich własnościach oraz na kryteriach służących ocenie podsumowań.
Termin: 2025-12-09, godz. 13.00-13.45
Miejsce: Platforma Teams
*
Prowadzący seminarium (UR): dr hab. Urszula Bentkowska prof. UR, dr Anna Król
Autor referatu: mgr inż. Piotr Magnuszewski (kooperacja dr hab. inż. Małgorzata Krętowska, prof. PB)
Temat: Poszukiwanie podobieństw między modelami uczenia głębokiego w analizie przeżycia
Streszczenie: Analiza przeżycia koncentruje się na danych, w których mamy do czynienia ze zdefiniowanymi zdarzeniami (początkowym i końcowym) oraz czasem, który między nimi upływa. Często analiza przeżycia stosowana jest w medycynie, gdzie dokonuje się np. predykcji czasu przeżycia pacjentów. W przypadku analizy przeżycia często napotykamy zjawisko odcięcia (and. censoring), które ma miejsce, gdy nie znamy dokładnego czasu zajścia zdarzenia końcowego. Nie powinniśmy pozbywać się tego typu próbek danych, ponieważ może to zaburzyć ogólny obraz sytuacji prezentowanej przez zbiór danych.
Przyglądając się literaturze związanej z analizą przeżycia możemy zaobserwować, że zaproponowane zostały do tej pory różne modele predykcyjne. Sytuacja jest tym bardziej urozmaicona, iż proponowane są także modele uczenia głębokiego. Ich zaletą jest to, że w porównaniu z modelami statystycznymi, nie stawiają tak poważnych założeń co do charakterystyki danych. Biorąc pod uwagę liczbę dostępnych metod, trudnym może się okazać sprawdzenie wszystkich w kontekście konkretnego problemu. Pożyteczne byłoby ustanowienie grup modeli, które przejawiają podobne zachowanie. Pozwoliłoby to ograniczyć ilość zasobów potrzebnych na wykonywanie badań.
W naszej pracy postanowiliśmy zbadać, czy możliwe byłoby ustanowienie miary podobieństwa modeli analizy przeżycia. Ograniczyliśmy wstępne badania do modeli uczenia głębokiego pracujących na czasie dyskretnym. Miarę podobieństwa utworzyliśmy bazując na wartościach SHAP oraz testach statystycznych. Wyniki naszych badań pokazały, że pewne modele przejawiają większe podobieństwo między sobą, a inne mniejsze (bazując na zaproponowanej mierze). Dodatkowo zaobserwowaliśmy, że wraz ze zwiększeniem procentowego udziału danych odciętych wzrasta poziom różnic między modelami. Jako dodatkowy rezultat prac, zaprezentowaliśmy wizualizację wyników, którą nazwaliśmy "arrow plots".
Termin: 2026-01-20, godz. 13.00-13.45
Miejsce: Platforma Teams