Sơ đồ quan hệ giữa các bảng như sau:
3.2. Mô hình phân tán CSDL, công cụ, ngôn ngữ lập trình
Cơ sở dữ liệu được phân tán trên 3 trạm, sử dụng hệ quản trị CSDL SQL Server 2008
• Trạm 1: gồm 2 bảng Customer (18484 bản ghi) và Geography (655 bản ghi).
• Trạm 2: bảng IntenetSales (60398 bản ghi)
• Trạm 3: bảng Product (606 bản ghi) Diễn giải các bước thực hiện của thuật toán.
Bước 1: Phân tách câu hỏi truy vấn thành các câu hỏi truy vấn trên từng máy trạm
Có thể bạn quan tâm!
- Tối ưu hóa truy vấn trong các cơ sở dữ liệu phân tán - 8
- Thuật Toán Hybrids Đàn Kiến Tối Ưu Truy Vấn Phân Tán
- Tối ưu hóa truy vấn trong các cơ sở dữ liệu phân tán - 10
- Tối ưu hóa truy vấn trong các cơ sở dữ liệu phân tán - 12
Xem toàn bộ 103 trang tài liệu này.
Bước 2: Tìm chi phí lớn nhất khi truyền dữ liệu (bỏ qua tốc độ băng thông mạng)
Chi phí truyền dữ liệu mạng chủ yếu là dung lượng bytes cần truy vấn. Để giảm chi phí truyền thông, chi phí trên máy trạm lớn nhất sẽ không truyền
đi. Thay vào đó các chi phí nhỏ hơn sẽ được truyền đi để thực hiện quá trình tích hợp dữ liệu.
Giao diện chính:
Giao diện kết nối máy trạm 1
Thông tin để kết nối trạm 1 gồm: IP máy trạm (hoặc tên máy), loại kết nối cơ sở dữ liệu (SQL server, Mysql, Microsoft Access,…), tên truy cập, mật khẩu, tên cơ sở dữ liệu sử dụng.
Giao diện kết nối máy trạm 2.
Các thông tin của trạm 2 gồm các thành phần cũng giống như trạm 1
Giao diện kết nối máy trạm 3.
Các thông tin của trạm 3 gồm các thành phần cũng giống như trạm 1 và trạm 2
Ứng dụng cho phép truy vấn trên từng máy trạm, với các câu truy vấn chỉ lấy dữ liệu trên từng máy đơn lẻ.
3.3. Thuật toán áp dụng
Chương trình sẽ cài đặt thử nghiệm thuật toán R* được trình bày ở mục 2.4.2
3.4. Kết quả thử nghiệm
Thử nghiệm 1: Truy vấn với câu hỏi như sau:
Select Customer. GeographyKey, Customer.FirstName, InternetSales.ProductKey, InternetSales.TotalProductCost From Customer, InternetSales
Where InternetSales.CustomerKey = Customer.CustomerKey
Truy vấn với cơ sở dữ liệu tập trung:
- Thời gian để thực hiện truy vấn và hiển thị là: 1093.75 Milliseconds
- Số lượng bản ghi trả về là 60398
Truy vấn với cơ sở dữ liệu phân tán:
- Thời gian để thực hiện truy vấn và hiển thị là: 1968.75 Miliseconds
- Số lượng bản ghi trả về là 60398
Các bước thực hiện câu truy vấn như hình bên dưới:
Thử nghiệm 2: Truy vấn với câu hỏi như sau:
Select Customer.GeographyKey, Customer.FirstName, InternetSales.ProductKey, InternetSales.TotalProductCost, Product.EnglishProductName
From Customer, InternetSales, Product
Where InternetSales.CustomerKey = Customer.CustomerKey and Product.ProductKey = InternetSales.ProductKey and Customer.GeographyKey = 11 and Product.Color = ‘Silver’
Truy vấn với cơ sở dữ liệu tập trung:
- Thời gian để thực hiện truy vấn và hiển thị là: 62.5 Milliseconds
- Số lượng bản ghi trả về là 17
Truy vấn với cơ sở dữ liệu phân tán:
- Thời gian để thực hiện truy vấn và hiển thị là: 875 Milliseconds
- Số lượng bản ghi trả về là 17
Các bước thực hiện câu truy vấn như hình bên dưới: