Hướng dẫn dora library python - thư viện dora python

Xem thảo luận

Cải thiện bài viết

Lưu bài viết

  • Đọc
  • Bàn luận
  • Xem thảo luận

    Cải thiện bài viết

    Lưu bài viết

    Đọc

    Bàn luận

    Dora là một thư viện được thiết kế để đơn giản hóa phân tích dữ liệu khám phá, đó là một phần đau đớn. Nó tự động hóa các nhiệm vụ lặp đi lặp lại tiêu thụ hầu hết thời gian. & NBSP;

    Installation:

    pip install Dora
    

    Usage:

    Thư viện có các chức năng rất thuận tiện cho việc làm sạch dữ liệu, trực quan hóa, trích xuất tính năng và lựa chọn, trực quan hóa. Ngoài ra, nó cũng được sử dụng để xác thực mô hình bằng cách phân vùng dữ liệu và chuyển đổi dữ liệu.

    Python3

    Thư viện này sử dụng Scikit-Learn, Gandas và Matplotlib. Mục đích của thư viện này là thêm các tính năng bổ sung vào thư viện chung được đề cập trước đây để phân tích dữ liệu khám phá. & NBSP;

    • Đơn hàng để thực hiện nó trong các bộ dữ liệu sử dụng cú pháp dưới đây:
    • Nó có thể được sử dụng cho:
    • Đọc dữ liệu & cấu hình
    • Làm sạch
    • Lựa chọn và trích xuất tính năng
    • Hình dung

    Mẫu chính thức

    Phiên bản dữ liệu

    Dưới đây là triển khai cơ bản nhất của mô -đun Dora trên bộ dữ liệu trong Python: & NBSP;

    Python

    from Dora import Dora

    $ python setup.py install
    
    9

    Output:

    Dora là một thư viện để lấy mẫu hoạt động Bayes với các mô hình không tham số.

    Dora đồng thời xây dựng một mô hình không tham số của một quy trình có thể quan sát được và chỉ đạo các phép đo mới để tìm hiểu về quy trình. Vốn dĩ, cần có các hành động để cải thiện mô hình [thăm dò] và để đạt được các mục tiêu mong muốn với kiến ​​thức [thăm dò] của nó.

    Các mô hình được sử dụng là các mô hình không tham số như nội suy song tuyến của một tam giác Delaunay hoặc hồi quy quy trình Gaussian. Chúng tôi đang xây dựng công cụ này để có thể cắm vào các mô hình khác, vì vậy sẽ sớm có thể liên kết trong gói Revrand của chúng tôi để hồi quy tuyến tính Bayesian nhanh chóng hoạt động tương tự như hồi quy GP để có thể áp dụng cho mô hình kernel như mô hình Bộ dữ liệu.

    Các tính năng chính của Dora là:

    • Thư viện Python để thiết kế lấy mẫu thử nghiệm để khám phá đồng thời và khai thác một quá trình cơ bản
    • Một dịch vụ web yên tĩnh có thể được gọi từ bất kỳ Launguages ​​nào khác cung cấp chức năng cốt lõi của thư viện Python
    • Khả năng sử dụng nhiều mô hình quy trình bao gồm hồi quy quy trình Gaussian [1], tam giác Delaunay và các mô hình từ Thư viện Revrand [2].
    • Một bộ chiến lược để tiến hành lấy mẫu thông tin, rủi ro hoặc giá trị để tìm hiểu các mô hình này một cách hiệu quả hoặc nhắm mục tiêu vào hiện tượng quan tâm.

    Bắt đầu nhanh¶

    Để cài đặt, chỉ cần chạy setup.py:setup.py:

    $ python setup.py install
    

    hoặc cài đặt với PIP:pip:

    $ pip install git+//github.com/nicta/dora.git@release
    

    Tham khảo tài liệu/cài đặt.RST để biết hướng dẫn cài đặt nâng cao.

    Hãy xem một số bản demo, ví dụ:

    $ python demo/demo_gp_python_api.py
    

    Các bản demo bao gồm các ví dụ về các mô hình cơ bản khác nhau [GP và Delaunay] và các ví dụ về cả mã Python 3 gọi trực tiếp API và trường hợp gọi chung là gọi máy chủ thông qua giao diện REST HTTP.

    Dưới đây là một ví dụ rất ngắn gọn về cách sử dụng lấy mẫu hoạt động với mô hình quy trình Gaussian trong Python. Chúng tôi giả sử rằng chúng tôi có thể thu thập một số dữ liệu đào tạo hạn chế với các mục tiêu ồn ào y_train, đầu vào X_Train cho mục đích chọn các siêu phân tích mô hình ban đầu và giờ đây chúng tôi muốn sử dụng lấy mẫu được nhắm mục tiêu để tiếp tục khám phá một cách hiệu quả.y_train, inputs X_train for the purpose of selecting initial model hyperparameters, and we now want to use targeted sampling to efficiently continue the exploration.

    $ import dora.active_sampling as dora import
    dora.regressors.gp as gp from example_processes import simulate_measurement
    import numpy as np
    # Set up a sampling problem:
    n_initial_sample = 50
    lower = [0, 0]
    upper = [1, 1]
    X_train = dora.random_sample[lower, upper, n_initial_sample]
    y_train = np.asarray[[simulate_measurement[i] for i in X_train]]
    
    # Set up a sampler using Dora
    sampler = dora.Gaussian_Process[lower, upper, X_train, y_train,
                                    add_train_data=False]
    
    # Run the active sampling:
    logging.info['Actively sampling new points..']
    target_samples = 501
    for i in range[target_samples]:
        # Note - Dora provides a sample X, and a sample Id
        # While we are doing this in a loop, in reality the observations can
        # be asynchronously observed and returned out of order.
        newX, newId = sampler.pick[]
        observation = simulate_measurement[newX]
        sampler.update[newId, observation]
    

    Lỗi & Phản hồi Bur

    Đối với lỗi, câu hỏi và thảo luận, vui lòng sử dụng các vấn đề của GitHub.

    Người giới thiệu¶

    [1]Các quy trình của Gaussian để học máy, Carl Edward Rasmussen và Chris Williams, The MIT Press, 2006
    [2]Thư viện Nicta Revrand.
    [3]Ostern, M. [2010]. Các quy trình Gaussian Bayesian để dự đoán tuần tự, tối ưu hóa và quadrature [luận án tiến sĩ]. Luận án tiến sĩ, Đại học Oxford.
    [4]Garnett, R., Ostern, M. A., & Roberts, S. J. [2010]. Tối ưu hóa Bayes cho lựa chọn bộ cảm biến. Hội nghị quốc tế về xử lý thông tin trong các mạng cảm biến [trang 209 Từ219].

    Bản quyền & Giấy phép Bur

    Bản quyền 2015 National CNTT Úc.

    Được cấp phép theo giấy phép Apache, phiên bản 2.0 ["giấy phép"]; Bạn không được sử dụng tệp này ngoại trừ tuân thủ giấy phép. Bạn có thể có được một bản sao giấy phép tại:

    //www.apache.org/licenses/LICENSE-2.0

    Trừ khi theo yêu cầu của luật hiện hành hoặc đồng ý bằng văn bản, phần mềm được phân phối theo giấy phép được phân phối trên cơ sở "như là", không có bảo hành hoặc điều kiện dưới bất kỳ hình thức nào, thể hiện hoặc ngụ ý. Xem giấy phép cho các quyền và giới hạn ngôn ngữ cụ thể theo giấy phép.

    Bài Viết Liên Quan

    Chủ Đề