Một số cải tiến thuật toán Index-BitTableFI cho khai thác tập tin phổ biến

  • Lê Hoài Bắc Khoa CNTT, Trường Đại học Khoa học Tự nhiên Tp HCM.
  • Nguyễn Thị Bảo Chi Viễn Thông Ninh Thuận.
  • Võ Đình Bảy Trường Cao đẳng CNTT TP. HCM

Abstract

Index-BitTableFI is an algorithm based on BitTable which is very effective in recent (Song& Yang, 2008). It finds out itemsets based on BitTable in vertical and horizontal, and also sets up sorting array and  equivalent  computing  method  to  fast  identify itemsets which occur concurrently with representative items.  Although  Index-BitTableFI  algorithm  reduces considerablely  cost  of  finding  out  candidate  itemsets and  computing  the  support,  but  if  number  of transactions  and  items  is  large  then  intersection computing  of  vector-bits  in  BitTable  still  costs  time. Besides, finding out frequent itemsets in depth hasnot used property of equivalent computing method yet. To resolve  this  problem,  some  improvements  for improving  more  performance  of  Index-BitTableFI algorithm are proposed in this research.

Author Biographies

Lê Hoài Bắc, Khoa CNTT, Trường Đại học Khoa học Tự nhiên Tp HCM.

Hiện là Phó Trưởng khoa, Trưởng Bộ môn Khoa học Máy tính, khoa CNTT, Trường Đại học  Khoa học Tự nhiên Tp HCM.

Hướng nghiên cứu: Trí tuệ nhân tạo, Tính toán mềm và Data mining.

Nguyễn Thị Bảo Chi, Viễn Thông Ninh Thuận.

Sinh năm 1976.

Tốt nghiệp Đại học năm 1998 tại Đại học Đà Lạt và thạc sĩ tại Trường Đại học Khoa học Tự nhiên TP. HCM năm 2011.

Hiện công tác tại Viễn Thông Ninh Thuận.

Lĩnh vực nghiên cứu: Khai thác dữ liệu.

Điện thoại: 0918951167,

Email: binhchichau@yahoo.com

Võ Đình Bảy, Trường Cao đẳng CNTT TP. HCM

Sinh năm 1974.

Tốt nghiệp Đại học năm 2002, Cao học năm 2005 và Tiến sĩ năm 2011 tại Trường Đại học Khoa học Tự nhiên TP.HCM.

Qiện đang là Trưởng phòng quản lý Nghiên cứu Khoa học và CNTT, Trường Cao đẳng CNTT TP. HCM.

Hướng nghiên cứu: Khai thác luật kết hợp, Khai thác mẫu tuần tự, Phân lớp dữ liệu, Khai thác dữ liệu trên cơ sở dữ liệu phân tán, Khai thác dữ liệu trên cơ sở dữ liệu tăng trưởng.

Điện thoại: 0903696987,

Email: bayvodinh@gmail.com

Published
2014-09-12
Section
Bài báo