Thành thật mà nói - Sr. Chi phí Kế toán MGR ở đây. Đã tước đội của tôi từ Excel vào SQL World In202. Trên thực tế, tôi biết tôi có đến tháng 12 năm 2022 để chuyển chúng từ SQL sang một số hình thức Python hoặc mọi quy trình chúng tôi sẽ thất bại với khối lượng dữ liệu tuyệt đối. Cho dù chúng tôi tổng hợp dữ liệu trong SQL như thế nào, tôi cũng có thể nhận được ít hơn 50 nghìn hàng dữ liệu trước khi bị buộc vào Excel.
Chúng tôi đang xem xét việc nhảy vào các dạng Python khác nhau vì Oracle có thể giải quyết các vấn đề của chúng tôi khi chúng tôi [một mình nhóm của tôi] đang dành 400k mỗi năm trên nền tảng. Nếu bạn muốn ở trong một công ty dữ liệu lớn, SQL là #1, thì Tableau hoặc công cụ trực quan khác, thì Python.
Python đã rất tuyệt vời cho công cụ loại bỏ web và hóa đơn cho API to Oracle Tool nhưng tôi phải đưa nhóm của mình ra khỏi Excel và Vlookups.
Nếu bạn muốn bắt đầu một cuộc tranh luận giữa hai nhà khoa học dữ liệu tài chính, hãy hỏi họ ngôn ngữ mã hóa nào họ thích sử dụng: R hay Python? Nếu họ có một sự khác biệt về quan điểm, thì một cuộc tranh luận sôi nổi và tình cảm chắc chắn sẽ theo sau. Nhưng ai đúng?
R bây giờ là ngôn ngữ được sử dụng tốt nhất cho khoa học dữ liệu
Theo truyền thống R là phổ biến hơn trong cộng đồng khoa học dữ liệu, do sự phổ biến của nó trong các trường đại học. Do đó, nhiều nhà khoa học dữ liệu neophyte đã sử dụng R trong MSC hoặc Tiến sĩ của họ, thực sự tôi lần đầu tiên tôi đã tự mình sử dụng ngôn ngữ khi hoàn thành luận án thạc sĩ của mình.
Tuy nhiên, Python đã bắt kịp. Năm 2016 R là ngôn ngữ phổ biến nhất trong số các nhà khoa học dữ liệu, với Python đứng thứ hai. Vào năm 2018, các vị trí của họ đã bị đảo ngược, với hai phần ba số người trả lời khảo sát thích Python so với 49% cho R.
R luôn có các gói tốt nhất
Trong lịch sử R đã có rất nhiều gói để phân tích và trực quan hóa thống kê. Các thư viện phổ biến bao gồm dplyr, sở thú và ggplot2; Và có hàng tá nữa. Python đã chậm để bắt kịp, nhưng hiện có rất nhiều gói có sẵn cho các nhà khoa học dữ liệu vừa chớm nở, như gấu trúc, scipy và matplotlib.
Thật dễ dàng để viết mã xấu trong R & NBSP;
R được trích dẫn rộng rãi là khó học nếu bạn quen với các ngôn ngữ chính thống hơn. Ngoài ra, trong thử nghiệm của tôi, rất dễ dàng để viết mã xấu trong R, và phần nào dễ dàng viết Python tốt hơn. Lập trình định hướng đối tượng [OOP] trong R đặc biệt xấu. OOP trong R được bắt vít như một suy nghĩ lại, thay vì là một phần không thể thiếu của ngôn ngữ như trong Python.
Cả R và Python đều là ngôn ngữ được gõ động. Điều này làm cho chúng rất linh hoạt, nhưng cũng có khả năng dễ bị lỗi. Tuy nhiên, việc đánh máy yếu trong R là đặc biệt nguy hiểm. Các chức năng R có thói quen khó chịu là trả lại các loại đối tượng bất ngờ, và sau đó quá thoải mái về việc chấp nhận loại sai như một đối số. Điều này gây khó khăn cho việc gỡ lỗi mã, vì chương trình thường sẽ làm hỏng hàng ngàn dòng sau khi xảy ra lỗi thực tế.
R chậm hơn Python & NBSP;
Các lập trình viên Java luôn chế nhạo về việc Python chậm như thế nào. Nhưng Python vẫn nhanh hơn đáng kể so với R; bởi khoảng một yếu tố của bốn. Cả hai ngôn ngữ có thể được tăng tốc lên đến một mức độ bằng cách nhúng mã C hoặc C ++, nhưng giao diện để thực hiện việc này trong R là nhiều hơn so với Python.
Python tốt hơn cho các hệ thống giao dịch
Có thể sử dụng cùng một ngôn ngữ trong môi trường nghiên cứu và sản xuất là một lợi thế lớn để triển khai nhanh chóng. & NBSP; Tôi đã sử dụng R cho các hệ thống giao dịch trực tiếp tự động trong quá khứ, nhưng tôi sẽ không làm như vậy nữa. Việc quản lý bộ nhớ trong R rất kém và các vấn đề đánh máy được đề cập ở trên có thể dẫn đến các lỗi kỳ lạ khó gỡ lỗi. Python dễ dàng tùy thuộc vào công việc chạy các chiến lược giao dịch trực tiếp, miễn là độ trễ không quan trọng [trong trường hợp C ++ hoặc Java có thể là lựa chọn tốt hơn]. Nó có một số vấn đề nổi tiếng, chẳng hạn như khóa phiên dịch toàn cầu, nhưng nói chung, đây là một nền tảng khá mạnh mẽ để chạy mã sản xuất.
Tóm lại là...
Đối với khoa học dữ liệu thuần túy, r vẫn có một lợi thế nhẹ so với Python, mặc dù khoảng cách đã thu hẹp đáng kể. Tuy nhiên, các ứng dụng rộng hơn của Python làm cho nó trở thành lựa chọn toàn diện tốt hơn. Nếu bạn bắt đầu sự nghiệp thì việc học Python cũng sẽ cung cấp cho bạn nhiều lựa chọn hơn trong tương lai.
Robert Carver là cựu người đứng đầu thu nhập cố định tại Quỹ phòng hộ định lượng AHL. Ông bắt đầu sử dụng R vào năm 2005 và chuyển sang Python vào năm 2011. Robert là tác giả của 'Giao dịch có hệ thống' và 'Danh mục đầu tư thông minh
Có một câu chuyện bí mật, tiền boa hoặc nhận xét mà bạn muốn chia sẻ? Liên hệ: Trong trường hợp đầu tiên. WhatsApp/Tín hiệu/Telegram cũng có sẵn. Chịu đựng chúng tôi nếu bạn để lại một bình luận ở cuối bài viết này: Tất cả các bình luận của chúng tôi đều được kiểm duyệt bởi con người. Đôi khi những người này có thể ngủ, hoặc tránh xa bàn làm việc của họ, vì vậy có thể mất một thời gian để nhận xét của bạn xuất hiện. Cuối cùng, nó sẽ - trừ khi nó gây khó chịu hoặc phỉ báng [trong trường hợp đó, nó đã thắng.] in the first instance. Whatsapp/Signal/Telegram also available. Bear with us if you leave a comment at the bottom of this article: all our comments are moderated by human beings. Sometimes these humans might be asleep, or away from their desks, so it may take a while for your comment to appear. Eventually it will – unless it’s offensive or libelous [in which case it won’t.]