Rok akademicki 2024/2025
Semestr zimowy 2024/2025
Prowadzący seminarium (UR): dr hab. Urszula Bentkowska prof. UR, dr hab. Paweł Drygaś, prof. UR
Autor referatu: dr inż. Piotr Lasek
Temat: Employing Aggregations of Fuzzy Equivalences in Clustering Algorithms
Streszczenie: In our recent work we proposed an approach to the k-means clustering algorithm incorporating a variety of fuzzy equivalences and aggregation techniques. Central to this approach is the use of fuzzy equivalences, which serve as an alternative to standard distance metrics, with the goal of improving the clustering process. The modified k-means algorithm employs these fuzzy equivalences to better determine the similarity between the data points, particularly in situations where the nearest points may not adequately represent closeness within the data set. To assess the clustering results, we employed a variation of the silhouette coefficient tailored to our method. Additionally, we will present theoretical insights into the behavior and benefits of using composition of aggregations and fuzzy equivalences in clustering.
Termin: 2024-10-15, godz. 13.00-13.45
Miejsce: Platforma Teams
*
Prowadzący seminarium (UŚ): dr hab. Agnieszka Nowak Brzezińska prof. UŚ, dr hab. Beata Zielosko prof. UŚ
Autor referatu: dr Krzysztof Wróbel
Temat: Metoda identyfikacji osób wykorzystująca odciski czerwieni wargowej
Streszczenie: W referacie omówiona zostanie metoda identyfikacji osób oparta na analizie odcisków czerwieni wargowej, znanej jako cheiloskopia. Jest to technika wykorzystywana w kryminalistyce, która pozwala na identyfikację jednostek na podstawie unikalnych cech wzoru linii znajdujących się na powierzchni warg. Przedstawione zostaną etapy pre-processingu obrazu odcisku ust, takie jak filtracja i segmentacja, mające na celu poprawę jakości obrazu oraz przygotowanie go do dalszej analizy. Kluczowym elementem będzie ekstrakcja cech charakterystycznych odcisków, w tym struktur linii wargowych, które stanowią podstawę do procesu klasyfikacji. Omówione zostaną również techniki klasyfikacyjne wykorzystywane w analizie, takie jak metody oparte na sztucznej inteligencji, które pomagają w automatyzacji procesu identyfikacji. Dodatkowo, poruszony zostanie problem odcisków niekompletnych, które mogą stanowić wyzwanie w analizie, a także sposoby radzenia sobie z tego typu przypadkami.
Termin: 2024-11-26, godz. 13.00-13.45
Miejsce: Platforma Teams
*
Prowadzący seminarium (UR): dr hab. Urszula Bentkowska prof. UR, dr hab. Paweł Drygaś prof. UR
Autorzy referatu: dr hab. inż. Teresa Mroczek prof. WSIiZ, dr inż. Łukasz Piątek
Temat: Analiza i klasyfikacja obrazów zmian melanocytowych skóry
Streszczenie: Według portalu WorldLifeExpectancy prawie 100 tys. ludzi na świecie umiera każdego roku z powodu nowotworów skóry, większość z tej liczby z powodu czerniaka złośliwego. Czerniak charakteryzuje się szybkim wzrostem, łatwym tworzeniem przerzutów oraz powoduje dużą śmiertelność chorych, jeżeli nie zostanie wcześnie zdiagnozowany. Wcześnie czyli już na etapie wizyty u lekarza rodzinnego. Dlatego opracowaliśmy specjalizowane algorytmy do automatycznego rozpoznawanie raka skóry na podstawie obrazów mikroskopii oraz zobrazowań z tomografu multifotonowego. Naszym celem jest dedykowany system - DigiSkinDia – który umożliwi obiektywną i dokładną diagnostykę.
Termin: 2025-01-07, godz. 13.00-13.45
Miejsce: Platforma Teams
*
Prowadzący seminarium (UŚ): dr hab. Agnieszka Nowak Brzezińska prof. UŚ, dr hab. Beata Zielosko prof. UŚ
Autor referatu: mgr Evans Teiko Tetteh (kooperacja dr hab. Beata Zielosko prof. UŚ)
Temat: Learning Decision Rules from Set of Decision Trees
Streszczenie: The presentation concerns the issue of induction of decision rules from distributed data, i.e., problems of learning general and inner decision rules from a set of decision trees. Inner rules refer to the paths within decision trees from the root to terminal nodes, while general rules are arbitrary rules derived from attributes found in the set of decision trees. The author will present heuristics for these problems and experimental results related to classification and knowledge representation.
Termin: 2025-01-21, godz. 13.00-13.45
Miejsce: Platforma Teams
Semestr letni 2024/2025
Streszczenie: As big data continues to grow, independent systems within specialized domains generate vast amounts of siloed data. Integrating these dispersed data sources into predictive models can unlock powerful improvements in model generalization, but doing so requires overcoming inconsistencies and privacy-related challenges. Talk delves into the use of deep learning techniques to address classification problems involving dispersed data. By leveraging neural networks’ ability to approximate functions and handle complex relationships, research proposes methods that obtain high quality for dispersed data. Specifically, we introduce a system that generates prediction vectors from each independent data source. Additionally, we explore constructing a global model using a linear combination of models from individual data tables, enabling aggregation across diverse structures. This approach allows for effective dispersed data collaboration.
Prowadzący seminarium (UR): dr hab. Urszula Bentkowska prof. UR, dr hab. Paweł Drygaś prof. UR
Autor: dr inż. Dariusz Bober
Temat: Relacyjna metoda redystrybucji kosztu w procesach współbieżnych o niejednorodnej podstawie czasu
Streszczenie: Struktura organizacyjna przedsiębiorstw produkcyjnych jest typowo hierarchiczna: zakład (1:m) wydziałów; wydział (1:n) linii produkcyjnych; linia (1: k) współbieżnie realizowanych procesów produkcyjnych w danej jednostce czasu. Hierarchia ta nie jest jednak zachowana w wymiarze kosztów zaangażowanych w realizację tychże procesów produkcyjnych. Często, gdy na jednej linii produkcyjnej realizowane są dwa lub trzy procesy produkcyjne, to odbywają się one z inną wydajnością każdego z k-procesów (przykład: przemiał mąki i pochodna produkcja otrębów, lub produkcja makaronu o tej samej formie ale w dwa różne opakowania na dwu współbieżnych paczkarkach, w ramach tej samej linii produkcyjnej). Skutek jest taki, że w systemie informatycznym rejestrującym uzysk z każdego k-procesu pojawia się różna podstawa czasu ewidencji danego uzysku (np. inny czas naważania opakowania o gramaturze 300 gram a inna dla gramatury 450 gram). Podstawa czasu całkowania jest inna dla każdego z procesów Δt(k1) <> Δt(k2). Podobnie jest ze zużyciem mediów energetycznych służących do zasilania poszczególnych linii – często dane medium jest podłączone do więcej niż 1 linii (np. sprężarkownia jest 1 na wydziale, a sprężone powietrze jest wykorzystywane przez wszystkie linie na danym wydziale – z różną intensywnością, zależnie od potrzeb; czy energia elektryczna jest z rozdzielni napięcia poprowadzona do zasilenia wielu linii lub odcinków linii danego wydziału). Daje to relację danego medium (1:n) linii produkcyjnych. Przy czym licznik ewidencji danego medium (np. energii elektrycznej) ewidencjonuje zużycie tylko na urządzeniach podpiętych do obwodu opomiarowanego przez ten licznik. Jeżeli mamy kilka liczników opomiarowujących poszczególne odcinki linii, a ponadto urządzenia te (jak np. sprężarkownia) są współdzielone przez kilka linii to powstaje nam relacja liczniki (l:n) linii produkcyjnych. Ponadto systemy ewidencji mediów są często rozwiązaniami autonomicznymi, z własną podstawą czasu próbkowania Δt(k) <> Δt(l), jak również działającymi pod kontrolą odrębnych systemów IT do ewidencji danych pomiarowych, wobec systemów IT zarządzania produkcją.Powyższe jest uogólnionym opisem problemu ewidencji danych w silosach systemów ewidencji procesów współbieżnych, rozumianych jako zjawiska zachodzące w tej samej przestrzeni geograficznej (jeden zakład produkcyjny) i w tej samej przestrzeni czasu (system zmianowości organizacji pracy). Obecnie wrażliwym wyzwaniem przed inżynierami systemów BI staje się redukcja zjawiska „silosowości informacji” i opracowywania metod reprezentacji wielowymiarowej takich współbieżnych procesów, niezależnie z którego źródła dana wartość opisująca proces pochodzi. Tu przykładem kosztu niech pozostanie zużycie energii elektrycznej ewidencjonowane z dokładnością do 1 kg wyrobu produkowanego w każdym z k-procesów.
Biorąc pod uwagę, że większość systemów ICT w przedsiębiorstwie, niezależnie od ich architektury, na najniższym poziomie gromadzi dane w bazach danych, a bazy te dają się przetransponować do formatu tabel, pojawia się możliwość zdefiniowana opisanego problemu jako zapytania SQL do tabel temporalnych, z różną podstawą czasu i relacji zależności l:n:k.
Zadanie takie zostało zrealizowane w praktyce, a wnioski przedstawię na seminarium.
Termin: 2025-03-25, godz. 13.00-13.45
Miejsce: Platforma Teams
*
Prowadzący seminarium (UŚ): dr hab. Beata Zielosko prof. UŚ, dr hab. Agnieszka Nowak-Brzezińska prof. UŚ
Autor: mgr Weronika Łazarz
Temat: Pseudo-etykietowanie dla danych kategorycznych z wykorzystaniem iteracyjnej ekspansji klastrów
Streszczenie: Uzyskanie w pełni oznaczonych zestawów danych w wielu rzeczywistych zastosowaniach jest kosztowne i czasochłonne, co skłania do stosowania metod pseudo-etykietowania. To wyzwanie jest szczególnie złożone, gdy zestaw danych jest całkowicie kategoryczny. W takich przypadkach klasyczne modele klasyfikacji wymagają technik kodowania w celu przekształcenia zmiennych kategorycznych w formę numeryczną. Kodowanie binarne, chociaż skuteczne w rozróżnianiu wartości kategorycznych, zwiększa rozmiar zestawu danych i koszty obliczeniowe oraz może powodować utratę informacji o relacjach między kategoriami. Dlatego w ramach badań zaproponowano metodę pseudo-etykietowania dla danych kategorycznych z wykorzystaniem iteracyjnej ekspansji klastrów, jako alternatywne podejście do klasyfikacji danych. W przeciwieństwie do tradycyjnych technik bazujących na progach prawdopodobieństwa, ta metoda identyfikuje najbardziej wiarygodne obserwacje na podstawie ich odległości od klastrów, stopniowo rozszerzając te klastry o nowe elementy oraz przenosząc niepasujące obiekty między grupami. Zastosowanie tej strategii prowadzi do stabilnego, liniowego wzrostu wydajności, co czyni ją szczególnie użyteczną w warunkach ograniczonej liczby oznaczonych danych. W badaniach wykazano, że metoda ta osiąga wyższą dokładność niż modele drzewiaste w przypadku małych zbiorów treningowych, ustępując im jedynie przy znacznym zwiększeniu udziału oznakowanych obserwacji. Wyniki te wskazują na wysoki potencjał pseudo-etykietowania opartego na klastrach jako skutecznej techniki wspomagania uczenia maszynowego w sytuacjach ograniczonego dostępu do etykietowanych danych.
Termin: 2025-04-29, godz. 13.00-13.45
Miejsce: Platforma Team
*
Prowadzący seminarium (UR): dr hab. Urszula Bentkowska prof. UR, dr hab. Paweł Drygaś prof. UR
Autor: dr inż. Michał Kępski
Temat: Ciągłe rozpoznawanie języka migowego technikami uczenia głębokiego
Streszczenie: Wystąpienie skupi się na najważniejszych metodach stosowanych w automatycznym tłumaczeniu języka migowego w sposób ciągły (ang. Continuous Sign Language Recognition, CSLR). W odróżnieniu od klasyfikacji izolowanych gestów lub wykrywania pojedynczych znaków (sign spotting), które polegają na rozpoznawaniu predefiniowanych gestów z dokładnie określonymi ramami czasowymi, w CLSR każdy materiał wideo zawiera uporządkowane etykiety głosów, jednak bez dokładnych granic czasowych dla poszczególnych znaków. Podczas seminarium omówione zostaną nowoczesne techniki CLSR, szczególnie modele sekwencyjne, konwolucyjne oraz architektury transformerów, efektywnie modelujące kontekst temporalny i wizualny w nagraniach wideo. Zaprezentowane zostaną także wstępne wyniki własnych badań dotyczące zastosowania tych modeli do analizy materiałów wideo z językiem migowym.
Termin: 2025-05-13, godz. 13.00-13.45
Miejsce: Platforma Teams