并行算法,是目前比较有效的改进手段;在现有条件下,把算法:(1)改成支持多核,性能会有明显提升;(2)改成GPU,性能会有数量级的提升(当然,还要看显卡的性能)。由于算法的优化也比较复杂,这还是项有难度的工作。
OpenCLPyOpenCLAnaconda/NumbaPro这几个都可以