Hướng dẫn how does python store long integers? - python lưu trữ số nguyên dài như thế nào?
Phụ trợ @unacademy • Dữ liệu @Amazon • Nền tảng @Practo | Viết về ngôn ngữ nội bộ và toán học trong khoa học máy tính Show
Khi bạn mã hóa bằng ngôn ngữ cấp thấp như C, bạn lo lắng về việc chọn đúng loại dữ liệu và vòng loại cho số nguyên của bạn; Ở mỗi bước, bạn cần phải suy nghĩ nếu Trong C, khi bạn cố gắng tính toán 2²⁰⁰⁰⁰ bằng cách sử dụng chức năng Construction 0, nó cung cấp cho bạn 1 làm đầu ra.
Nhưng đối với Python, nó là một miếng bánh 🎂
Python phải làm một cái gì đó đẹp trong nội bộ để hỗ trợ các số nguyên có kích thước tùy ý và hôm nay chúng tôi tìm ra những gì dưới mui xe! Đại diện và định nghĩaMột số nguyên trong Python là một cấu trúc C được xác định như sau
2 là một macro mở rộng thành 3 có cấu trúc sau
Các loại khác có 2 là
Điều này chỉ ra rằng một số nguyên, giống như 8 hoặc 9, có độ dài khác nhau và đây là cái nhìn sâu sắc đầu tiên của chúng tôi về cách nó có thể hỗ trợ các số nguyên dài. 0 sau khi mở rộng macro có thể được coi là
Giải mã struct _longobject { PyObject_VAR_HEAD digit ob_digit[1]; }; 2 2 là một mảng loại 6, được đánh máy từ 7, được phân bổ tĩnh cho chiều dài 8. Vì nó là một mảng, 2 chủ yếu là 0, con trỏ đến 6, và do đó nếu được yêu cầu có thể được cắt ở bất kỳ độ dài nào. Điều này làm cho Python có thể đại diện và xử lý các số nguyên dài.Nói chung, trong các ngôn ngữ cấp thấp như C, độ chính xác của các số nguyên được giới hạn ở mức 64 bit, nhưng Python thực hiện các số nguyên chính xác tùy ý. Vì Python 3, tất cả các số nguyên được biểu diễn dưới dạng bignum và chúng chỉ bị giới hạn bởi bộ nhớ có sẵn của hệ thống máy chủ. Giải mã struct _longobject { PyObject_VAR_HEAD digit ob_digit[1]; }; 3 3 giữ số lượng các yếu tố trong 2. Để hiệu quả hơn trong khi phân bổ bộ nhớ thành mảng 2, các sự cung cấp quá mức của Python và sau đó dựa vào giá trị của 3 để xác định số lượng các phần tử thực tế được giữ trong mảng.KhoMột cách ngây thơ để lưu trữ một số nguyên chữ số là bằng cách thực sự lưu trữ một chữ số thập phân trong một mục của mảng và sau đó các hoạt động như bổ sung và trừ có thể được thực hiện giống như toán học lớp. Với cách tiếp cận này, một số 7 sẽ được lưu trữ dưới dạngCách tiếp cận này không hiệu quả vì chúng ta sẽ sử dụng tăng 32 bit chữ số ( 7) để lưu trữ một chữ số thập phân thực sự chỉ dao động từ 0 đến 9 và có thể dễ dàng được biểu thị bằng 4 bit, và trong khi viết một cái gì đó linh hoạt như Python, Một nhà phát triển cốt lõi phải tháo vát hơn thế này.Vì vậy, chúng ta có thể làm tốt hơn không? Để chắc chắn, nếu không, bài viết này sẽ không giữ chỗ trên internet. Hãy đi sâu vào cách Python lưu trữ một số nguyên siêu dài. Cách pythonicThay vì chỉ lưu trữ một chữ số thập phân trong mỗi mục của mảng 2, Python chuyển đổi số từ cơ sở 10 thành cơ sở 2³⁰ và gọi từng phần tử là 6 dao động từ 0 đến 2³⁰ - 1.Trong hệ thống số thập lục phân, cơ sở là 16 ~ 2⁴ Điều này có nghĩa là mỗi "chữ số" của một số thập lục phân dao động từ 0 đến 15 của hệ thống thập phân. Tương tự đối với Python, "Digit" nằm trong cơ sở 2³⁰ có nghĩa là nó sẽ nằm trong khoảng từ 0 đến 2³⁰ - 1 = 1073741823 của hệ thống thập phân. Bằng cách này, Python sử dụng hiệu quả hầu hết tất cả không gian được phân bổ 32 bit mỗi chữ số và giữ cho chính nó tháo vát và vẫn thực hiện các hoạt động như bổ sung và trừ như toán học lớp.
Ví dụ: 1152921504606846976Như đã đề cập, đối với Python, một "chữ số" là cơ sở 2³⁰ do đó nếu bạn chuyển đổi 1 thành cơ sở 2³⁰ bạn sẽ nhận được 2.1152921504606846976 = 0 * (2³⁰) ⁰ + 0 * (2³⁰) ¹ + 1 * (2³⁰) ² = 0 * (2³⁰)⁰ + 0 * (2³⁰)¹ + 1 * (2³⁰)² Cấu trúc 0 cho giá trị này sẽ được giữ
Tôi đã tạo ra một bản demo sẽ xuất hiện theo cách mà Python đang lưu trữ các số nguyên trong nội bộ và cũng có tham chiếu đến các thành viên cấu trúc như 3, 9, v.v.Hoạt động trên các số nguyên siêu dàiBây giờ chúng ta có một ý tưởng công bằng về cách Python hỗ trợ và thực hiện các số nguyên chính xác tùy ý của nó để hiểu làm thế nào các hoạt động toán học khác nhau xảy ra với chúng. Phép cộngCác số nguyên vẫn tồn tại "khôn ngoan về chữ số", điều này có nghĩa là sự bổ sung cũng đơn giản như những gì chúng ta học được ở trường lớp và mã nguồn của Python cho chúng ta thấy rằng đây chính xác là cách nó được thực hiện. Hàm có tên X_ADD trong Tệp LongObject.c thực hiện việc bổ sung hai số.
Đoạn mã ở trên được lấy từ hàm 0 và bạn có thể thấy rằng nó lặp lại trên các chữ số và thực hiện bổ sung-khôn ngoan và tính toán và truyền tải mang theo.
Phép trừTương tự như cách bổ sung được thực hiện, phép trừ cũng xảy ra theo chữ số. Hàm có tên x_sub trong Tệp LongObject.c thực hiện phép trừ hai số.
Đoạn mã ở trên được lấy từ hàm 5 và bạn có thể thấy cách nó lặp lại trên các chữ số và thực hiện phép trừ và tính toán và truyền bá Burrow. Rất giống với bổ sung thực sự.Phép nhânMột lần nữa, một cách ngây thơ để thực hiện phép nhân sẽ là những gì chúng ta học được trong toán học lớp nhưng nó sẽ không hiệu quả. Python, để giữ cho mọi thứ hiệu quả thực hiện thuật toán Karatsuba nhân lên hai số N-chữ số trong các bước cơ bản O (Nˡᵒᵍ³). Thuật toán hơi phức tạp nằm ngoài phạm vi của bài viết này nhưng bạn có thể tìm thấy việc triển khai của nó trong các hàm k_mul và k_lopsided_mul trong tệp longobject.c. Bộ phận và các hoạt động khácTất cả các hoạt động trên số nguyên được xác định trong tệp longoBject.c và nó rất đơn giản để định vị và theo dõi từng cái. CẢNH BÁO: Sẽ mất một thời gian để hiểu chi tiết từng người một số bỏng ngô trước khi bạn bắt đầu lướt qua. Tối ưu hóa các số nguyên thường được sử dụngPython preall phân biến các số nguyên nhỏ trong phạm vi từ -5 đến 256. Phân bổ này xảy ra trong quá trình khởi tạo và vì chúng tôi không thể cập nhật số nguyên (tính bất biến) các số nguyên được phân tách này là đơn lẻ và được tham chiếu trực tiếp thay vì phân bổ lại. Điều này có nghĩa là mỗi khi chúng ta sử dụng/tạo ra một số nguyên nhỏ, python thay vì phân bổ lại chỉ trả về tham chiếu của một cái được phân bổ. Tối ưu hóa này có thể được truy tìm trong macro 6 và hàm get_small_int trong longobject.c. Bằng cách này, Python tiết kiệm rất nhiều không gian và tính toán cho các số nguyên thường được sử dụng.Đây là bài viết thứ hai trong sê -ri Python Internals. Bài viết đầu tiên là cách tôi thay đổi con trăn của mình và làm cho nó trở nên đáng ngờ và nó giúp bạn thực hiện những bước đầu tiên trong mã nguồn của Python và mở đường cho bạn để trở thành nhà phát triển Python Core. Bài viết này ban đầu được xuất bản trên blog của tôi - Làm thế nào Python thực hiện các số nguyên siêu dài ?. Nếu bạn muốn đọc thêm các bài viết như thế này, hãy đăng ký nhận bản tin của tôi và nhận bài đăng được gửi trực tiếp vào hộp thư đến của bạn. Tôi viết về kỹ thuật, thiết kế hệ thống và một chút lập trình, mỗi thứ Sáu. Hãy cho tôi một tiếng hét @arpit_bhayani. Bạn có thể tìm thấy các bài viết trước của tôi @arpitbhayani.me/blog. Làm thế nào để Python lưu trữ số nguyên trong bộ nhớ?Python sử dụng mảng ob_digit để lưu trữ từng chữ số của số một cách riêng biệt ở các vị trí chỉ mục khác nhau.Ngoài ra, biến OB_SIZE được sử dụng để lưu trữ hai giá trị.Nó lưu trữ độ dài của mảng ob_digit và dấu hiệu của số nguyên (dương hoặc âm).uses the ob_digit array to store each digit of the number separately in different index locations. Additionally, the ob_size variable is used to store two values. It stores the length of the ob_digit array and the sign of the integer (positive or negative).
Một số nguyên có thể lớn như thế nào trong Python trong 64 bit?int trong python3 không có giới hạn tối đa tối đa đã được thêm vào.sys.Tối đa là 2 ** 31-1 trên môi trường 32 bit và 2 ** 63-1 trên môi trường 64 bit, như SYS.Maxint trong Python2.2**63-1 on a 64-bit environment, like sys. maxint in Python2. |