亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

利用ctypes提高Python的執(zhí)行速度

原創(chuàng) 2017-01-16 14:16:54 407
摘要:前言ctypes是Python的外部函數(shù)庫。它提供了C兼容的數(shù)據(jù)類型,并且允許調(diào)用動態(tài)鏈接庫/共享庫中的函數(shù)。它可以將這些庫包裝起來給Python使用。這個引入C語言的接口可以幫助我們做很多事情,比如需要調(diào)用C代碼的來提高性能的一些小型問題。通過它你可以接入Windows系統(tǒng)上的 kernel32.dll 和 msvcrt.dll 動態(tài)鏈接庫,以及Linux系統(tǒng)上的 libc.so.6 庫。當(dāng)然你

前言

ctypes是Python的外部函數(shù)庫。它提供了C兼容的數(shù)據(jù)類型,并且允許調(diào)用動態(tài)鏈接庫/共享庫中的函數(shù)。它可以將這些庫包裝起來給Python使用。這個引入C語言的接口可以幫助我們做很多事情,比如需要調(diào)用C代碼的來提高性能的一些小型問題。通過它你可以接入Windows系統(tǒng)上的 kernel32.dll 和 msvcrt.dll 動態(tài)鏈接庫,以及Linux系統(tǒng)上的 libc.so.6 庫。當(dāng)然你也可以使用自己的編譯好的共享庫

我們先來看一個簡單的例子 我們使用 Python 求 1000000 以內(nèi)素數(shù),重復(fù)這個過程10次,并計算運(yùn)行時間。

import math
from timeit import timeit 
def check_prime(x):
  values = xrange(2, int(math.sqrt(x)) + 1)
  for i in values:
    if x % i == 0:
      return False
  return True 
def get_prime(n):
  return [x for x in xrange(2, n) if check_prime(x)] 
print timeit(stmt='get_prime(1000000)', setup='from __main__ import get_prime',
       number=10)

輸出

42.8259568214   

下面用C語言寫一個的 check_prime 函數(shù),然后把它當(dāng)作共享庫(動態(tài)鏈接庫)導(dǎo)入

#include <stdio.h>
#include <math.h>
int check_prime(int a)
{
  int c;
  for ( c = 2 ; c <= sqrt(a) ; c++ ) {
    if ( a%c == 0 )
      return 0;
  }
  return 1;
}

使用以下命令生成 .so (shared object)文件

gcc -shared -o prime.so -fPIC prime.c
import ctypes
import math
from timeit import timeit
check_prime_in_c = ctypes.CDLL('./prime.so').check_prime
 
 
def check_prime_in_py(x):
  values = xrange(2, int(math.sqrt(x)) + 1)
  for i in values:
    if x % i == 0:
      return False
  return True
 
 
def get_prime_in_c(n):
  return [x for x in xrange(2, n) if check_prime_in_c(x)]
 
 
def get_prime_in_py(n):
  return [x for x in xrange(2, n) if check_prime_in_py(x)]
 
 
py_time = timeit(stmt='get_prime_in_py(1000000)', setup='from __main__ import get_prime_in_py',
         number=10)
c_time = timeit(stmt='get_prime_in_c(1000000)', setup='from __main__ import get_prime_in_c',
        number=10)
print "Python version: {} seconds".format(py_time)
 
print "C version: {} seconds".format(c_time)

輸出

Python version: 43.4539749622 seconds

C version: 8.56250786781 seconds

   

我們可以看到很明顯的性能差距 這里有更多的方法去判斷一個數(shù)是否是素數(shù)

再來看一個復(fù)雜點(diǎn)的例子 快速排序

mylib.c
#include <stdio.h> 
typedef struct _Range {
  int start, end;
} Range; 
Range new_Range(int s, int e) {
  Range r;
  r.start = s;
  r.end = e;
  return r;
}
 
void swap(int *x, int *y) {
  int t = *x;
  *x = *y;
  *y = t;
}
 
void quick_sort(int arr[], const int len) {
  if (len <= 0)
    return;
  Range r[len];
  int p = 0;
  r[p++] = new_Range(0, len - 1);
  while (p) {
    Range range = r[--p];
    if (range.start >= range.end)
      continue;
    int mid = arr[range.end];
    int left = range.start, right = range.end - 1;
    while (left < right) {
      while (arr[left] < mid && left < right)
        left++;
      while (arr[right] >= mid && left < right)
        right--;
      swap(&arr[left], &arr[right]);
    }
    if (arr[left] >= arr[range.end])
      swap(&arr[left], &arr[range.end]);
    else
      left++;
    r[p++] = new_Range(range.start, left - 1);
    r[p++] = new_Range(left + 1, range.end);
  }
}
gcc -shared -o mylib.so -fPIC mylib.c

使用ctypes有一個麻煩點(diǎn)的地方是原生的C代碼使用的類型可能跟Python不能明確的對應(yīng)上來。比如這里什么是Python中的數(shù)組?列表?還是 array 模塊中的一個數(shù)組。所以我們需要進(jìn)行轉(zhuǎn)換

test.py
import ctypes
import time
import random
 
quick_sort = ctypes.CDLL('./mylib.so').quick_sort
nums = []
for _ in range(100):
  r = [random.randrange(1, 100000000) for x in xrange(100000)]
  arr = (ctypes.c_int * len(r))(*r)
  nums.append((arr, len(r)))
 
init = time.clock()
for i in range(100):
  quick_sort(nums[i][0], nums[i][1])
print "%s" % (time.clock() - init)

輸出

1.874907   

與Python list 的 sort 方法進(jìn)行對比

import ctypes
import time
import random 
quick_sort = ctypes.CDLL('./mylib.so').quick_sort
nums = []
for _ in range(100):
  nums.append([random.randrange(1, 100000000) for x in xrange(100000)]) 
init = time.clock()
for i in range(100):
  nums[i].sort()
print "%s" % (time.clock() - init)

輸出

2.501257   

至于結(jié)構(gòu)體,需要定義一個類,包含相應(yīng)的字段和類型

class Point(ctypes.Structure):
  _fields_ = [('x', ctypes.c_double),
        ('y', ctypes.c_double)]

除了導(dǎo)入我們自己寫的C語言擴(kuò)展文件,我們還可以直接導(dǎo)入系統(tǒng)提供的庫文件,比如linux下c標(biāo)準(zhǔn)庫的實(shí)現(xiàn) glibc

import time
import random
from ctypes import cdll
libc = cdll.LoadLibrary('libc.so.6') # Linux系統(tǒng)
# libc = cdll.msvcrt # Windows系統(tǒng)
init = time.clock()
randoms = [random.randrange(1, 100) for x in xrange(1000000)]
print "Python version: %s seconds" % (time.clock() - init)
init = time.clock()
randoms = [(libc.rand() % 100) for x in xrange(1000000)]
print "C version : %s seconds" % (time.clock() - init)

輸出

Python version: 0.850172 seconds
C version : 0.27645 seconds

更多關(guān)于利用ctypes提高Python的執(zhí)行速度請關(guān)注PHP中文網(wǎng)(ipnx.cn)其他文章!    


發(fā)布手記

熱門詞條