Một phương pháp phân cụm bán giám sát mờ đồng huấn luyện trên dữ liệu đa khung nhìn

A Semi-Supervised Fuzzy Clustering Co-Training Approach on Multi-View Data

  • Thi Canh Hoang
  • Phùng Thế Huân Thái Nguyên
  • Thuy Trang Vu TrườngĐại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội.
  • Truong Giang Le
  • Nhu Son Nguyen
  • Huy Thong Pham
Keywords: Dữ liệu đa khung nhìn, phân cụm đa khung nhìn, phân cụm bán giám sát mờ, thuật toán đồng huấn luyện

Abstract

In today’s practical reality, multi-view data is increasingly prevalent. Multi-view data refers to a type of data that encompasses multiple perspectives or viewpoints of an object. Data within each individual view possesses specific attributes dedicated to knowledge discovery and provides information on the same subject with varying degrees of accuracy and reliability. Combining various types of information from different views can yield a more comprehensive and accurate representation of objects, thereby improving data analysis and decision-making. Multi-view clustering has emerged as a research direction that has garnered the interest of scientists in recent years. However, there has been no research focusing on semi-supervised fuzzy clustering combined with co-training algorithms to assess the accuracy and quality of clustering on multi-view datasets. This paper proposes a novel method in semi-supervised clustering, utilizing co-training algorithms on multi-view data collected from a data source. Additionally, the paper provides experimental results to evaluate the effectiveness and accuracy of the proposed algorithm.

Author Biographies

Thi Canh Hoang

Hoàng Thị Cành tốt nghiệp Đại học Thái
Nguyên (ICTU). Nhận bằng Kỹ sư CNTT
tại ICTU năm 2009. Nhận bằng Thạc sĩ
KHMT tại ICTU năm 2012. Hiện đang
NCS tại Viện Hàn lâm Khoa học và Công
nghệ Việt Nam và là giảng viên Trường Đại
học Công nghệ Thông tin và Truyền thông.
Các lĩnh vực nghiên cứu bao gồm Thị giác
máy tính, Nhận dạng mẫu, Khai phá dữ liệu, Tính toán mềm.
Email: htcanh@ictu.edu.vn

Thuy Trang Vu, TrườngĐại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội.

Vũ Thuỳ Trang hiện là sinh viên Trường
Đại học Khoa học Tự nhiên, Đại học Quốc
gia Hà Nội.
Các lĩnh vực nghiên cứu bao gồm Thị giác
máy tính, Nhận dạng mẫu, Khai phá dữ
liệu, Tính toán mềm, Logic mờ.
Email: vuthuytrangt_65@hus.edu.vn

Truong Giang Le

Lê Trường Giang nhận bằng Kỹ sư Khoa
học máy tính năm 2011 tại Trường Đại học
Công nghiệp Hà Nội và Thạc sĩ Khoa học
máy tính tại Trường Đại học Công nghệ
Thông tin và Truyền thông, Đại học Thái
Nguyên (ICTU) năm 2014. Nhận bằng Tiến
sĩ Hệ thống thông tin tại Học viện Khoa
học Công nghệ, Viện Hàn lâm Khoa học
và Công nghệ Việt Nam năm 2023. Hiện là cán bộ tại Trung tâm
Đảm bảo Chất lượng, Trường Đại học Công nghiệp Hà Nội.
Các lĩnh vực nghiên cứu bao gồm Tối ưu hóa, Học máy, Khai phá
dữ liệu, Trí tuệ nhân tạo, Tính toán mềm, Logic mờ.
Email: letruonggiang@haui.edu.vn

Nhu Son Nguyen

Nguyễn Như Sơn nhận bằng Tiến sĩ Khoa
học máy tính tại Đại học Queensland -
Australia năm 2007. Hiện là giảng viên,
nghiên cứu viên tại Viện Công nghệ Thông
tin - Viện Hàn lâm Khoa học và Công nghệ
Việt Nam.
Các lĩnh vực nghiên cứu bao gồm Thị giác
máy tính, Học máy, Trí tuệ nhân tạo, Khai
phá dữ liệu, Tính toán mềm, Logic mờ.
Email: nnson@ioit.ac.vn

Huy Thong Pham

Phạm Huy Thông nhận bằng Tiến sĩ Toán
Tin tại Đại học Quốc Gia Hà Nội. Hiện là
giảng viên, nghiên cứu viên tại Viện Công
nghệ Thông tin – Đại học Quốc Gia Hà
Nội. Năm 2020.
Các lĩnh vực nghiên cứu bao gồm Tối ưu
hóa, Khai phá dữ liệu, Tính toán mềm,
Logic mờ.
Email: thongph@vnu.edu.vn

References

Al-Amri, Salem Saleh, and Namdeo V. Kalyankar. "Image segmentation by using threshold techniques." arXiv preprint arXiv:1005.4020 (2010).

Li, Xin, et al. "A multi-view model for visual tracking via correlation filters." Knowledge-Based Systems 113 (2016): 88-99.

Elkahky, Ali Mamdouh, Yang Song, and Xiaodong He. "A multi-view deep learning approach for cross domain user modeling in recommendation systems." Proceedings of the 24th international conference on world wide web. (2015).

Xu, Chang, Dacheng Tao, and Chao Xu. "A survey on multiview learning." arXiv preprint arXiv:1304.5634 (2013).

Zhu, Zhenfeng, et al. "Shared Subspace Learning for Latent Representation of Multi-View Data." J. Inf. Hiding Multim. Signal Process. 5.3 (2014): 546-554.

Yang, Yan, and Hao Wang. "Multi-view clustering: A survey." Big Data Mining and Analytics 1.2 (2018): 83-107.

Bickel, Steffen, and Tobias Scheffer. "Multi-view clustering." ICDM. Vol. 4. No. 2004. (2004).

Ye, Fanghua, et al. "New approaches in multi-view clustering." Recent applications in data clustering 195 (2018).

Xu, Chang, Dacheng Tao, and Chao Xu. "A survey on multiview learning." arXiv preprint arXiv:1304.5634 (2013).

Sun, Shiliang. "A survey of multi-view machine learning." Neural computing and applications 23 (2013): 2031-2038.

Chen, Rui, et al. "Deep multi-view semi-supervised clustering with sample pairwise constraints." Neurocomputing 500 (2022): 832-845.

Li, B., Li, X., Zhang, L., Yu, Z., & Wu, X. (2021), “Multiview clustering via robust probabilistic non-negative matrix factorization”, IEEE Transactions on Neural Networks and Learning Systems, 32(5), 1975-1986

Blum, Avrim, and Tom Mitchell. "Combining labeled and unlabeled data with co-training." Proceedings of the eleventh annual conference on Computational learning theory. (1998).

Ye, F., Chen, Z., Qian, H., Li, R., Chen, C., & Zheng, Z. New approaches in multi-view clustering. Recent applications in data clustering, 195.(2018).

Kumar, Abhishek, and Hal Daumé. "A co-training approach for multi-view spectral clustering." Proceedings of the 28th international conference on machine learning (ICML-11). (2011).

D. Dua and C. Graff, “UCI Machine Learning Repository,” 2019.[Online]. Available. http://archive.ics.uci.edu/ml. [Accessed Jan. 10, 2022].

Wang, Jiada, Yijun Liu, and Wujian Ye. "FMvC: Fast MultiView Clustering." IEEE Access 11 (2023): 12808- 2820.

Bernard, Desgraupes. "Clustering Indices." University Paris Ouest Lab Modal’X November (2017).

Published
2023-09-26