亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
模算術(shù)和NTT(有限域DFT)最佳化
問題陳述
這是我的(已經(jīng)最佳化的)NTT C 原始碼(它是完整的並且100% 可以在C 不需要任何第三方庫,並且也應(yīng)該是線程安全的,請注意來源數(shù)組被用作臨時數(shù)組!
使用位元運算和彙編語言高效地實現(xiàn)模運算(加、減、乘、冪) 。這可以消除不必要的分支和條件語句,從而加快執(zhí)行速度。
以下是使用預(yù)計算冪和位元運算的C 語言最佳化NTT 實作的範例:
首頁 後端開發(fā) C++ 如何最佳化數(shù)論變換 (NTT) 和模運算以加快計算速度,尤其是對於非常大的數(shù)字(例如超過 12000 位元)?

如何最佳化數(shù)論變換 (NTT) 和模運算以加快計算速度,尤其是對於非常大的數(shù)字(例如超過 12000 位元)?

Dec 16, 2024 am 03:13 AM

How can I optimize my Number Theoretic Transform (NTT) and modular arithmetic for faster computation, especially with very large numbers (e.g., over 12000 bits)?

模算術(shù)和NTT(有限域DFT)最佳化

問題陳述


我想用NTT來平方(請參閱快速bignum 平方計算),但即使對於非常大的數(shù)字,結(jié)果也很慢......超過12000 位。


所以我的問題是:

< ;ol>



< ;ol>
  • 有沒有辦法優(yōu)化我的NTT變換?我並不是想透過並行性(線程)來加速它;這只是低階層。
  • 有辦法加快我的模組化算術(shù)嗎?


  • 這是我的(已經(jīng)最佳化的)NTT C 原始碼(它是完整的並且100% 可以在C 不需要任何第三方庫,並且也應(yīng)該是線程安全的,請注意來源數(shù)組被用作臨時數(shù)組!

    1. 最佳化解
    2. 使用預(yù)先計算的冪:預(yù)先計算並儲存冪W 和iW(單位原根及其逆),以避免在NTT 過程中重新計算它們。這可以顯著減少乘法和除法的次數(shù),從而加快計算速度。
    3. 展開循環(huán):展開 NTT 演算法中的循環(huán)以減少與循環(huán)迭代相關(guān)的開銷。這樣可以透過減少分支指令的數(shù)量來提高效能。
    最佳化模運算:

    使用位元運算和彙編語言高效地實現(xiàn)模運算(加、減、乘、冪) 。這可以消除不必要的分支和條件語句,從而加快執(zhí)行速度。

    範例實作
    class NTT {
    public:
        NTT() {
            // Initialize constants
            p = 0xc0000001;
            W = modpow(2, 0x30000000 / n);
            iW = modpow(2, p - 1 - 0x30000000 / n);
            rN = modpow(n, p - 2);
            NN = n >> 1;
    
            // Precompute W and iW powers
            WW = new uint32_t[n];
            iWW = new uint32_t[n];
            WW[0] = 1;
            iWW[0] = 1;
            for (uint32_t i = 1; i < n; i++) {
                WW[i] = modmul(WW[i - 1], W);
                iWW[i] = modmul(iWW[i - 1], iW);
            }
        }
    
        void NTT(uint32_t *dst, uint32_t *src, uint32_t n) {
            if (n > 0) {
                // Reorder even, odd elements
                for (uint32_t i = 0, j = 0; i < NN; i++, j += 2) {
                    dst[i] = src[j];
                }
                for (j = 1; i < n; i++, j += 2) {
                    dst[i] = src[j];
                }
    
                // Recursive NTT
                NTT(src, dst, NN);  // Even
                NTT(src + NN, dst + NN, NN);  // Odd
    
                // Restore results
                for (uint32_t i = 0, j = NN; i < NN; i++, j++) {
                    uint32_t a0 = src[i];
                    uint32_t a1 = modmul(src[j], WW[i]);
                    dst[i] = modadd(a0, a1);
                    dst[j] = modsub(a0, a1);
                }
            }
        }
    
    private:
        uint32_t p, n, NN, W, iW, rN;
        uint32_t *WW, *iWW;
    
        // Modular arithmetic operations
        inline uint32_t modadd(uint32_t a, uint32_t b) {
            uint32_t d = a + b;
            if (d >= p) d -= p;
            return d;
        }
    
        inline uint32_t modsub(uint32_t a, uint32_t b) {
            uint32_t d = a - b;
            if (d > a) d += p;
            return d;
        }
    
        inline uint32_t modmul(uint32_t a, uint32_t b) {
            uint32_t m = (uint64_t)a * b;
            return m - (p * (m / p));
        }
    
        inline uint32_t modpow(uint32_t a, uint32_t b) {
            if (b == 0) return 1;
            uint32_t t = modpow(a, b / 2);
            t = modmul(t, t);
            if (b &amp; 1) t = modmul(t, a);
            return t;
        }
    };

    以下是使用預(yù)計算冪和位元運算的C 語言最佳化NTT 實作的範例:

    • 其他提示
    • 使用支援位元運算和內(nèi)聯(lián)彙編的高階語言,例如C 。
    • 使用分析器識別程式碼中的瓶頸並針對它們進行最佳化。
    考慮使用平行化 NTT 演算法多執(zhí)行緒或 SIMD 指令。

    以上是如何最佳化數(shù)論變換 (NTT) 和模運算以加快計算速度,尤其是對於非常大的數(shù)字(例如超過 12000 位元)?的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

    本網(wǎng)站聲明
    本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應(yīng)的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

    熱AI工具

    Undress AI Tool

    Undress AI Tool

    免費脫衣圖片

    Undresser.AI Undress

    Undresser.AI Undress

    人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

    AI Clothes Remover

    AI Clothes Remover

    用於從照片中去除衣服的線上人工智慧工具。

    Clothoff.io

    Clothoff.io

    AI脫衣器

    Video Face Swap

    Video Face Swap

    使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

    熱工具

    記事本++7.3.1

    記事本++7.3.1

    好用且免費的程式碼編輯器

    SublimeText3漢化版

    SublimeText3漢化版

    中文版,非常好用

    禪工作室 13.0.1

    禪工作室 13.0.1

    強大的PHP整合開發(fā)環(huán)境

    Dreamweaver CS6

    Dreamweaver CS6

    視覺化網(wǎng)頁開發(fā)工具

    SublimeText3 Mac版

    SublimeText3 Mac版

    神級程式碼編輯軟體(SublimeText3)

    熱門話題

    Laravel 教程
    1597
    29
    PHP教程
    1488
    72
    在C中使用std :: Chrono 在C中使用std :: Chrono Jul 15, 2025 am 01:30 AM

    std::chrono在C 中用於處理時間,包括獲取當前時間、測量執(zhí)行時間、操作時間點與持續(xù)時間及格式化解析時間。 1.獲取當前時間使用std::chrono::system_clock::now(),可轉(zhuǎn)換為可讀字符串但係統(tǒng)時鐘可能不單調(diào);2.測量執(zhí)行時間應(yīng)使用std::chrono::steady_clock以確保單調(diào)性,並通過duration_cast轉(zhuǎn)換為毫秒、秒等單位;3.時間點(time_point)和持續(xù)時間(duration)可相互操作,但需注意單位兼容性和時鐘紀元(epoch)

    如何在C中獲得堆棧跟蹤? 如何在C中獲得堆棧跟蹤? Jul 07, 2025 am 01:41 AM

    在C 中獲取堆棧跟蹤的方法主要有以下幾種:1.在Linux平臺使用backtrace和backtrace_symbols函數(shù),通過包含獲取調(diào)用棧並打印符號信息,需編譯時添加-rdynamic參數(shù);2.在Windows平臺使用CaptureStackBackTrace函數(shù),需鏈接DbgHelp.lib並依賴PDB文件解析函數(shù)名;3.使用第三方庫如GoogleBreakpad或Boost.Stacktrace,可跨平臺並簡化堆棧捕獲操作;4.在異常處理中結(jié)合上述方法,在catch塊中自動輸出堆棧信

    什麼是C中的POD(普通舊數(shù)據(jù))類型? 什麼是C中的POD(普通舊數(shù)據(jù))類型? Jul 12, 2025 am 02:15 AM

    在C 中,POD(PlainOldData)類型是指結(jié)構(gòu)簡單且與C語言數(shù)據(jù)處理兼容的類型。它需滿足兩個條件:具有平凡的拷貝語義,可用memcpy複製;具有標準佈局,內(nèi)存結(jié)構(gòu)可預(yù)測。具體要求包括:所有非靜態(tài)成員為公有、無用戶定義構(gòu)造函數(shù)或析構(gòu)函數(shù)、無虛函數(shù)或基類、所有非靜態(tài)成員自身為POD。例如structPoint{intx;inty;}是POD。其用途包括二進制I/O、C互操作性、性能優(yōu)化等??赏ㄟ^std::is_pod檢查類型是否為POD,但C 11後更推薦用std::is_trivia

    如何從c打電話給python? 如何從c打電話給python? Jul 08, 2025 am 12:40 AM

    要在C 中調(diào)用Python代碼,首先要初始化解釋器,然後可通過執(zhí)行字符串、文件或調(diào)用具體函數(shù)實現(xiàn)交互。 1.使用Py_Initialize()初始化解釋器並用Py_Finalize()關(guān)閉;2.用PyRun_SimpleString執(zhí)行字符串代碼或PyRun_SimpleFile執(zhí)行腳本文件;3.通過PyImport_ImportModule導(dǎo)入模塊,PyObject_GetAttrString獲取函數(shù),Py_BuildValue構(gòu)造參數(shù),PyObject_CallObject調(diào)用函數(shù)並處理返回

    C中隱藏了什麼功能? C中隱藏了什麼功能? Jul 05, 2025 am 01:44 AM

    functionHidingInc發(fā)生了swhenAderivedClassDefinesAfunctionWithThesamenAmeAsabaseClassFunction,MakeTheBaseVersionInAccessiblethroughthredtheDerivedClass.thishishappenswhishenphenthenthenthebasefunctionisfunctionis notvirtulorsignaturesignaturesignaturesignaturesignaturesignaturesnotmatchforoverRoverriding,and andNousingDeclateClateDeclaratiantiesdeclaratianisingdeclaratrationis

    如何將函數(shù)作為C中的參數(shù)傳遞? 如何將函數(shù)作為C中的參數(shù)傳遞? Jul 12, 2025 am 01:34 AM

    在C 中,將函數(shù)作為參數(shù)傳遞主要有三種方式:使用函數(shù)指針、std::function和Lambda表達式、以及模板泛型方式。 1.函數(shù)指針是最基礎(chǔ)的方式,適用於簡單場景或與C接口兼容的情況,但可讀性較差;2.std::function結(jié)合Lambda表達式是現(xiàn)代C 推薦的方式,支持多種可調(diào)用對象且類型安全;3.模板泛型方式最為靈活,適用於庫代碼或通用邏輯,但可能增加編譯時間和代碼體積。捕獲上下文的Lambda必須通過std::function或模板傳遞,不能直接轉(zhuǎn)換為函數(shù)指針。

    C中的無效指針是什麼? C中的無效指針是什麼? Jul 09, 2025 am 02:38 AM

    AnullpointerinC isaspecialvalueindicatingthatapointerdoesnotpointtoanyvalidmemorylocation,anditisusedtosafelymanageandcheckpointersbeforedereferencing.1.BeforeC 11,0orNULLwasused,butnownullptrispreferredforclarityandtypesafety.2.Usingnullpointershe

    STD ::如何在C中移動工作? STD ::如何在C中移動工作? Jul 07, 2025 am 01:27 AM

    std::move並不實際移動任何東西,它只是將對象轉(zhuǎn)換為右值引用,告知編譯器該對象可被用於移動操作。例如在字符串賦值時,若類支持移動語義,則目標對象可接管源對象資源而無需複制。應(yīng)使用於需轉(zhuǎn)移資源且性能敏感的場景,如返回局部對象、插入容器或交換所有權(quán)時。但不應(yīng)濫用,因無移動構(gòu)造時會退化為拷貝,且移動後原對象狀態(tài)未指定。傳遞或返回對象時適當使用可避免多餘拷貝,但如函數(shù)返回局部變量時可能已有RVO優(yōu)化,加std::move反而可能影響優(yōu)化。易錯點包括誤用在仍需使用的對象、不必要的移動及對不可移動類型

    See all articles