MỘT SỐ PHƯƠNG PHÁP HỌC MÁY XÁC ĐỊNH ĐẶC ĐIỂM NGƯỜI DÙNG TRÊN MẠNG INTERNET

pdf 153 trang Phương Linh 03/04/2025 40
Bạn đang xem 30 trang mẫu của tài liệu "MỘT SỐ PHƯƠNG PHÁP HỌC MÁY XÁC ĐỊNH ĐẶC ĐIỂM NGƯỜI DÙNG TRÊN MẠNG INTERNET", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdf1 Luanan_NCS DucDT.pdf
  • pdf2 Totat Luanan_DucDT.pdf
  • pdf3 Trang thong tin LA_DucDT (TV).pdf
  • pdf4 Trang thong tin LA_DucDT (TA).pdf

Nội dung tài liệu: MỘT SỐ PHƯƠNG PHÁP HỌC MÁY XÁC ĐỊNH ĐẶC ĐIỂM NGƯỜI DÙNG TRÊN MẠNG INTERNET

  1. TRANG THÔNG TIN LUẬN ÁN TIẾN SĨ Tên đề tài luận án tiến sĩ: MỘT SỐ PHƯƠNG PHÁP HỌC MÁY XÁC ĐỊNH ĐẶC ĐIỂM NGƯỜI DÙNG TRÊN MẠNG INTERNET Chuyên ngành: Kỹ thuật máy tính Mã số: 9.48.01.06 Họ và tên NCS: Dương Trần Đức Người hướng dẫn khoa học: 1. PGS. TS. Phạm Bảo Sơn 2. TS. Tân Hạnh Đơn vị đào tạo: Học viện Công nghệ Bưu chính Viễn thông Cơ sở đào tạo: Học viện Công nghệ Bưu chính Viễn thông NHỮNG KẾT QUẢ MỚI CỦA LUẬN ÁN: - Nghiên cứu việc ứng dụng các loại đặc trưng và phương pháp nhận diện khác nhau, trong đó tập trung phân tích sâu về các đặc trưng dựa trên nội dung, cho vấn đề xác định đặc điểm tác giả bài viết diễn đàn tiếng Việt. Trước đây, đã có một số công trình nghiên cứu việc sử dụng các từ nội dung cho việc xác định đặc điểm tác giả văn bản, nhưng chưa có các phân tích sâu. Đặc biệt, chưa có nghiên cứu nào thực hiện trên ngôn ngữ tiếng Việt. - Đề xuất một loại đặc trưng mới cho việc xác định đặc điểm tác giả bài viết diễn đàn tiếng Việt. Các đặc trưng mới giúp cho việc nhận diện có độ chính xác cao hơn các đặc trưng cơ bản (dựa trên phong cách), có tính độc lập hơn so với các đặc trưng nội dung, và khi kết hợp với các đặc trưng phong cách hoặc nội dung thì cho kết quả cao hơn. Đây là các đặc trưng dựa trên đặc thù tiếng Việt như vần và âm tiết, tuy nhiên cũng có thể mở rộng áp dụng sang các ngôn ngữ khác và các loại văn bản khác. - Nghiên cứu vấn đề dự đoán giới tính khách hàng dựa trên dữ liệu lịch sử truy cập hệ TMĐT. Nghiên cứu các phương pháp trích chọn đặc trưng và phân loại hiệu quả,
  2. trong đó đề xuất phương pháp trích chọn đặc trưng sử dụng biểu diễn dạng cây của danh sách sản phẩm và phân loại. CÁC ỨNG DỤNG, KHẢ NĂNG ỨNG DỤNG TRONG THỰC TIỄN HOẶC NHỮNG VẤN ĐỀ CÒN BỎ NGỎ CẦN TIẾP TỤC NGHIÊN CỨU: Khả năng ứng dụng trong thực tiễn: Các kết quả nghiên cứu của luận án có khả năng ứng dụng thực tiễn cao, đặc biệt là trong các hệ thống có nhu cầu cá nhân hóa cao nhằm mục đích tăng trải nghiệm người dùng và phục vụ quảng cáo trực tuyến, giới thiệu sản phẩm đúng mục tiêu mà không có đầy đủ thông tin người dùng như các hệ thống website, diễn đàn, mạng xã hội, hệ thống TMĐT. Những vấn đề bỏ ngỏ cần tiếp tục nghiên cứu: Nghiên cứu, khai thác các đặc trưng ngôn ngữ của tiếng Việt để tìm kiếm các loại đặc trưng mới cho nhận diện tác giả văn bản. Chẳng hạn các đặc trưng liên quan đến tính chất ngữ pháp, sử dụng thanh điệu, hình vị v.v. Mở rộng nghiên cứu xác định đặc điểm tác giả văn bản sang các loại văn bản khác như các bài viết/bình luận mạng xã hội, các bình luận/đánh giá của người dùng trên mạng Internet. Mở rộng nghiên cứu xác định đặc điểm người dùng dựa trên phân tích hành vi qua các loại hệ thống khác so với thương mại điện tử như các diễn đàn, các hệ thống mạng xã hội. Ngoài ra, đối với các hệ thống có lưu trữ dữ liệu đồng thời về các bài viết và hành vi của người dùng (như các hệ thống mạng xã hội), có thể kết hợp cả hai loại đặc trưng dựa trên văn bản và dựa trên hành vi để cho ra kết quả nhận diện chính xác hơn. Xác nhận của người hướng dẫn khoa học Nghiên cứu sinh PGS. TS. Phạm Bảo Sơn Dương Trần Đức