paint-brush
क्या एनवीडिया आरटीएक्स ए4000 एडीए मशीन लर्निंग कार्य संभाल सकता है? द्वारा@hostkey
3,026 रीडिंग
3,026 रीडिंग

क्या एनवीडिया आरटीएक्स ए4000 एडीए मशीन लर्निंग कार्य संभाल सकता है?

द्वारा Hostkey.com15m2023/06/29
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

अप्रैल में, एनवीडिया ने एक नया उत्पाद, आरटीएक्स ए4000 एडीए लॉन्च किया, जो वर्कस्टेशन अनुप्रयोगों के लिए डिज़ाइन किया गया एक छोटा फॉर्म फैक्टर जीपीयू है। यह प्रोसेसर A2000 की जगह लेता है और इसका उपयोग वैज्ञानिक अनुसंधान, इंजीनियरिंग गणना और डेटा विज़ुअलाइज़ेशन सहित जटिल कार्यों के लिए किया जा सकता है। नए GPU की 20GB मेमोरी क्षमता इसे बड़े वातावरण को संभालने में सक्षम बनाती है।
featured image - क्या एनवीडिया आरटीएक्स ए4000 एडीए मशीन लर्निंग कार्य संभाल सकता है?
Hostkey.com HackerNoon profile picture
0-item

अप्रैल में, एनवीडिया ने एक नया उत्पाद, आरटीएक्स ए4000 एडीए लॉन्च किया, जो वर्कस्टेशन अनुप्रयोगों के लिए डिज़ाइन किया गया एक छोटा फॉर्म फैक्टर जीपीयू है। यह प्रोसेसर A2000 की जगह लेता है और इसका उपयोग वैज्ञानिक अनुसंधान, इंजीनियरिंग गणना और डेटा विज़ुअलाइज़ेशन सहित जटिल कार्यों के लिए किया जा सकता है।


RTX A4000 ADA में 6,144 CUDA कोर, 192 Tensor और 48 RT कोर और 20GB GDDR6 ECC VRAM है। नए GPU का एक प्रमुख लाभ इसकी बिजली दक्षता है: RTX A4000 ADA केवल 70W की खपत करता है, जो बिजली की लागत और सिस्टम गर्मी दोनों को कम करता है। GPU आपको इसकी 4x मिनी-डिस्प्लेपोर्ट 1.4a कनेक्टिविटी की बदौलत कई डिस्प्ले चलाने की भी अनुमति देता है।





RTX 4000 SFF ADA GPU की समान श्रेणी के अन्य उपकरणों से तुलना करते समय, यह ध्यान दिया जाना चाहिए कि एकल परिशुद्धता मोड में चलने पर, यह नवीनतम पीढ़ी के RTX A4000 GPU के समान प्रदर्शन दिखाता है, जो दोगुनी बिजली (140W बनाम) की खपत करता है। 70W).





ADA RTX 4000 SFF ADA लवलेस आर्किटेक्चर और 5nm प्रोसेस टेक्नोलॉजी पर बनाया गया है। यह अगली पीढ़ी के टेन्सर कोर और रे ट्रेसिंग कोर को सक्षम बनाता है, जो आरटीएक्स ए4000 की तुलना में तेज और अधिक कुशल रे ट्रेसिंग और टेन्सर कोर प्रदान करके प्रदर्शन में काफी सुधार करता है। इसके अलावा, एडीए का आरटीएक्स 4000 एसएफएफ एक छोटे पैकेज में आता है - कार्ड 168 मिमी लंबा और दो विस्तार स्लॉट जितना मोटा है।





बेहतर किरण अनुरेखण कर्नेल उन वातावरणों में कुशल प्रदर्शन की अनुमति देता है जहां प्रौद्योगिकी का उपयोग किया जाता है, जैसे कि 3डी डिजाइन और रेंडरिंग में। इसके अलावा, नए GPU की 20GB मेमोरी क्षमता इसे बड़े वातावरण को संभालने में सक्षम बनाती है।





निर्माता के अनुसार, चौथी पीढ़ी के टेन्सर कोर उच्च एआई कम्प्यूटेशनल प्रदर्शन प्रदान करते हैं - पिछली पीढ़ी की तुलना में प्रदर्शन में दोगुनी वृद्धि। नए Tensor कोर FP8 त्वरण का समर्थन करते हैं। यह नवोन्मेषी सुविधा जीनोमिक्स और कंप्यूटर विज़न जैसे वातावरण में एआई मॉडल विकसित करने और तैनात करने वालों के लिए अच्छा काम कर सकती है।


यह भी ध्यान देने योग्य बात है कि एन्कोडिंग और डिकोडिंग तंत्र में वृद्धि आरटीएक्स 4000 एसएफएफ एडीए को वीडियो जैसे मल्टीमीडिया वर्कलोड के लिए एक अच्छा समाधान बनाती है।



NVIDIA RTX A4000 और RTX A5000 ग्राफ़िक्स कार्ड, RTX 3090 की तकनीकी विशिष्टताएँ


आरटीएक्स ए4000 एडीए

एनवीडिया आरटीएक्स ए4000

एनवीडिया आरटीएक्स ए5000

आरटीएक्स 3090

वास्तुकला

एडा लवलेस एम्पेयर एम्पेयर एम्पेयर

तकनीकी प्रक्रिया

5 एनएम 8 एनएम 8 एनएम 8 एनएम

जीपीयू

एडी104 GA102 GA104 GA102

ट्रांजिस्टर की संख्या (लाखों)

35,800 17,400 28,300 28,300

मेमोरी बैंडविड्थ (जीबी/एस)

280.0 448 768 936.2

वीडियो मेमोरी क्षमता (बिट्स)

160 256 384 384

जीपीयू मेमोरी (जीबी)

20 16 24 24

मेमोरी प्रकार

जीडीडीआर6 जीडीडीआर6 जीडीडीआर6 GDDR6X

CUDA कोर

6,144 6 144 8192 10496

टेंसर कोर

192 192 256 328

आरटी कोर

48 48 64 82

एसपी पर्फ (टेराफ्लॉप्स)

19.2 19,2 27,8 35,6

आरटी कोर प्रदर्शन (टेराफ्लॉप्स)

44.3 37,4 54,2 69,5

टेंसर प्रदर्शन (टेराफ्लॉप्स)

306.8 153,4 222,2 285

अधिकतम शक्ति (वाट)

70 140 230 350

इंटरफेस

पीसीआईई 4.0 x 16 पीसीआई-ई 4.0 x16 पीसीआई-ई 4.0 x16 पीसीआईई 4.0 x16

कनेक्टर्स

4x मिनी डिस्प्लेपोर्ट 1.4ए डीपी 1.4 (4) डीपी 1.4 (4) डीपी 1.4 (4)

बनाने का कारक

2 स्लॉट 1 स्लॉट 2 स्लॉट 2-3 स्लॉट

वीजीपीयू सॉफ्टवेयर

नहीं नहीं हाँ, असीमित हाँ। सीमाओं के साथ

एनवीलिंक

नहीं नहीं 2x आरटीएक्स ए5000 हाँ

सीयूडीए समर्थन

11.6 8.6 8.6 8.6

वल्कन समर्थन

1.3 हाँ हाँ हाँ, 1.2

मूल्य (USD)

1,250 1000 2500 1400



परीक्षण वातावरण का विवरण


आरटीएक्स ए4000 एडीए आरटीएक्स ए4000
CPU AMD Ryzen 9 5950X 3.4GHz (16 कोर) ऑक्टाकोर इंटेल झियोन ई-2288जी, 3.5 गीगाहर्ट्ज़
टक्कर मारना 4x 32 जीबी डीडीआर4 ईसीसी एसओ-डीआईएमएम 2x 32 जीबी डीडीआर4-3200 ईसीसी डीडीआर4 एसडीआरएएम 1600 मेगाहर्ट्ज
गाड़ी चलाना 1टीबी एनवीएमई एसएसडी सैमसंग एसएसडी 980 प्रो 1टीबी
मदरबोर्ड ASRock X570D4I-2T आसुस P11C-I सीरीज
ऑपरेटिंग सिस्टम माइक्रोसॉफ्ट विंडोज 10 माइक्रोसॉफ्ट विंडोज 10



परीक्षा के परिणाम


वी-रे 5 बेंचमार्क

अंक अर्जित किये गये


अंक अर्जित किये गये


वी-रे जीपीयू सीयूडीए और आरटीएक्स परीक्षण सापेक्ष जीपीयू रेंडरिंग प्रदर्शन को मापते हैं। RTX A4000 GPU, RTX A4000 ADA (क्रमशः 4% और 11%) से थोड़ा पीछे है।


यंत्र अधिगम


"कुत्ते बनाम बिल्लियाँ"

तंत्रिका नेटवर्क के लिए जीपीयू के प्रदर्शन की तुलना करने के लिए, हमने "कुत्ते बनाम बिल्लियाँ" डेटासेट का उपयोग किया - परीक्षण एक तस्वीर की सामग्री का विश्लेषण करता है और यह पहचानता है कि तस्वीर में बिल्ली या कुत्ता दिखाई दे रहा है या नहीं। सभी आवश्यक कच्चा डेटा पाया जा सकता है . हमने यह परीक्षण विभिन्न जीपीयू और क्लाउड सेवाओं पर चलाया और निम्नलिखित परिणाम प्राप्त किए:


इस परीक्षण में, RTX A4000 ADA ने RTX A4000 से 9% बेहतर प्रदर्शन किया, लेकिन नए GPU के छोटे आकार और कम बिजली खपत को ध्यान में रखें।




एआई-बेंचमार्क आपको एआई मॉडल आउटपुट कार्य के दौरान डिवाइस के प्रदर्शन को मापने की अनुमति देता है। माप की इकाई परीक्षण के अनुसार भिन्न हो सकती है, लेकिन आमतौर पर यह प्रति सेकंड संचालन की संख्या (ओपीएस) या फ्रेम प्रति सेकंड (एफपीएस) की संख्या होती है।


अंक अर्जित किये गये




आरटीएक्स ए4000

आरटीएक्स ए4000 एडीए

1/19. मोबाइलनेट-V2

1.1 - अनुमान | बैच=50, आकार=224x224: 38.5 ± 2.4 एमएस1.2 — प्रशिक्षण | बैच=50, आकार=224x224: 109 ± 4 एमएस 1.1 - अनुमान | बैच=50, आकार=224x224: 53.5 ± 0.7 एमएस1.2 — प्रशिक्षण | बैच=50, आकार=224x224: 130.1 ± 0.6 एमएस

2/19. आरंभ-V3

2.1 - अनुमान | बैच=20, आकार=346x346: 36.1 ± 1.8 एमएस2.2 — प्रशिक्षण | बैच=20, आकार=346x346: 137.4 ± 0.6 एमएस 2.1 - अनुमान | बैच=20, आकार=346x346: 36.8 ± 1.1 एमएस2.2 — प्रशिक्षण | बैच=20, आकार=346x346: 147.5 ± 0.8 एमएस

3/19. आरंभ-V4

3.1 - अनुमान | बैच=10, आकार=346x346: 34.0 ± 0.9 एमएस3.2 — प्रशिक्षण | बैच=10, आकार=346x346: 139.4 ± 1.0 एमएस 3.1 - अनुमान | बैच=10, आकार=346x346: 33.0 ± 0.8 एमएस3.2 — प्रशिक्षण | बैच=10, आकार=346x346: 135.7 ± 0.9 एमएस

4/19. इंसेप्शन-रेसनेट-V2

4.1 - अनुमान | बैच=10, आकार=346x346: 45.7 ± 0.6 एमएस4.2 — प्रशिक्षण | बैच=8, आकार=346x346: 153.4 ± 0.8 एमएस 4.1 - अनुमान बैच = 10, आकार = 346x346: 33.6 ± 0.7 एमएस4.2 - प्रशिक्षण बैच = 8, आकार = 346x346: 132 ± 1 एमएस

5/19. रेसनेट-V2-50

5.1 — अनुमान | बैच=10, आकार=346x346: 25.3 ± 0.5 एमएस5.2 — प्रशिक्षण | बैच=10, आकार=346x346: 91.1 ± 0.8 एमएस 5.1 — अनुमान | बैच=10, आकार=346x346: 26.1 ± 0.5 एमएस5.2 — प्रशिक्षण | बैच=10, आकार=346x346: 92.3 ± 0.6 एमएस

6/19. रेसनेट-V2-152

6.1 - अनुमान | बैच=10, आकार=256x256: 32.4 ± 0.5 एमएस6.2 — प्रशिक्षण | बैच=10, आकार=256x256: 131.4 ± 0.7 एमएस 6.1 - अनुमान | बैच=10, आकार=256x256: 23.7 ± 0.6 एमएस6.2 — प्रशिक्षण | बैच=10, आकार=256x256: 107.1 ± 0.9 एमएस

7/19. वीजीजी-16

7.1 — अनुमान | बैच=20, आकार=224x224: 54.9 ± 0.9 एमएस7.2 — प्रशिक्षण | बैच=2, आकार=224x224: 83.6 ± 0.7 एमएस 7.1 — अनुमान | बैच=20, आकार=224x224: 66.3 ± 0.9 एमएस7.2 — प्रशिक्षण | बैच=2, आकार=224x224: 109.3 ± 0.8 एमएस

8/19. एसआरसीएनएन 9-5-5

8.1 — अनुमान | बैच=10, आकार=512x512: 51.5 ± 0.9 एमएस8.2 — अनुमान | बैच=1, आकार=1536x1536: 45.7 ± 0.9 एमएस8.3 — प्रशिक्षण | बैच=10, आकार=512x512: 183 ± 1 एमएस 8.1 — अनुमान | बैच=10, आकार=512x512: 59.9 ± 1.6 एमएस8.2 — अनुमान | बैच=1, आकार=1536x1536: 53.1 ± 0.7 एमएस8.3 — प्रशिक्षण | बैच=10, आकार=512x512: 176 ± 2 एमएस

9/19. वीजीजी-19 सुपर-रेस

9.1 - अनुमान | बैच=10, आकार=256x256: 99.5 ± 0.8 एमएस9.2 — अनुमान | बैच=1, आकार=1024x1024: 162 ± 1 एमएस9.3 — प्रशिक्षण | बैच=10, आकार=224x224: 204 ± 2 एमएस


10/19. रेसनेट-एसआरजीएएन

10.1 — अनुमान | बैच=10, आकार=512x512: 85.8 ± 0.6 एमएस10.2 — अनुमान | बैच=1, आकार=1536x1536: 82.4 ± 1.9 एमएस10.3 — प्रशिक्षण | बैच=5, आकार=512x512: 133 ± 1 एमएस 10.1 — अनुमान | बैच=10, आकार=512x512: 98.9 ± 0.8 एमएस10.2 — अनुमान | बैच=1, आकार=1536x1536: 86.1 ± 0.6 एमएस10.3 — प्रशिक्षण | बैच=5, आकार=512x512: 130.9 ± 0.6 एमएस

11/19. रेसनेट-डीपीईडी

11.1 — अनुमान | बैच=10, आकार=256x256: 114.9 ± 0.6 एमएस11.2 — अनुमान | बैच=1, आकार=1024x1024: 182 ± 2 एमएस11.3 — प्रशिक्षण | बैच=15, आकार=128x128: 178.1 ± 0.8 एमएस 11.1 — अनुमान | बैच=10, आकार=256x256: 146.4 ± 0.5 एमएस11.2 — अनुमान | बैच=1, आकार=1024x1024: 234.3 ± 0.5 एमएस11.3 — प्रशिक्षण | बैच=15, आकार=128x128: 234.7 ± 0.6 एमएस

12/19. यू-नेट

12.1 — अनुमान | बैच=4, आकार=512x512: 180.8 ± 0.7 एमएस12.2 — अनुमान | बैच=1, आकार=1024x1024: 177.0 ± 0.4 एमएस12.3 — प्रशिक्षण | बैच=4, आकार=256x256: 198.6 ± 0.5 एमएस 12.1 — अनुमान | बैच=4, आकार=512x512: 222.9 ± 0.5 एमएस12.2 — अनुमान | बैच=1, आकार=1024x1024: 220.4 ± 0.6 एमएस12.3 — प्रशिक्षण | बैच=4, आकार=256x256: 229.1 ± 0.7 एमएस

13/19. एनवीडिया-स्पेड

13.1 — अनुमान | बैच=5, आकार=128x128: 54.5 ± 0.5 एमएस13.2 — प्रशिक्षण | बैच=1, आकार=128x128: 103.6 ± 0.6 एमएस 13.1 — अनुमान | बैच=5, आकार=128x128: 59.6 ± 0.6 एमएस13.2 — प्रशिक्षण | बैच=1, आकार=128x128: 94.6 ± 0.6 एमएस

14/19. आईसीनेट

14.1 — अनुमान | बैच=5, आकार=1024x1536: 126.3 ± 0.8 एमएस14.2 — प्रशिक्षण | बैच=10, आकार=1024x1536: 426 ± 9 एमएस 14.1 — अनुमान | बैच=5, आकार=1024x1536: 144 ± 4 एमएस14.2 — प्रशिक्षण | बैच=10, आकार=1024x1536: 475 ± 17 एमएस

15/19. पीएसपीनेट

15.1 — अनुमान | बैच=5, आकार=720x720: 249 ± 12 एमएस15.2 — प्रशिक्षण | बैच=1, आकार=512x512: 104.6 ± 0.6 एमएस 15.1 — अनुमान | बैच=5, आकार=720x720: 291.4 ± 0.5 एमएस15.2 — प्रशिक्षण | बैच=1, आकार=512x512: 99.8 ± 0.9 एमएस

16/19. डीपलैब

16.1 — अनुमान | बैच=2, आकार=512x512: 71.7 ± 0.6 एमएस16.2 — प्रशिक्षण | बैच=1, आकार=384x384: 84.9 ± 0.5 एमएस 16.1 — अनुमान | बैच=2, आकार=512x512: 71.5 ± 0.7 एमएस16.2 — प्रशिक्षण | बैच=1, आकार=384x384: 69.4 ± 0.6 एमएस

17/19. पिक्सेल-आरएनएन

17.1 — अनुमान | बैच=50, आकार=64x64: 299 ± 14 एमएस17.2 — प्रशिक्षण | बैच=10, आकार=64x64: 1258 ± 64 एमएस 17.1 — अनुमान | बैच=50, आकार=64x64: 321 ± 30 एमएस17.2 — प्रशिक्षण | बैच=10, आकार=64x64: 1278 ± 74 एमएस

18/19. LSTM-भावना

18.1 — अनुमान | बैच=100, आकार=1024x300: 395 ± 11 एमएस18.2 — प्रशिक्षण | बैच=10, आकार=1024x300: 676 ± 15 एमएस 18.1 — अनुमान | बैच=100, आकार=1024x300: 345 ± 10 एमएस18.2 — प्रशिक्षण | बैच=10, आकार=1024x300: 774 ± 17 एमएस

19/19. जीएनएमटी-अनुवाद

19.1 — अनुमान | बैच=1, आकार=1x20: 119 ± 2 एमएस 19.1 — अनुमान | बैच=1, आकार=1x20: 156 ± 1 एमएस


इस परीक्षण के नतीजे बताते हैं कि आरटीएक्स ए4000 का प्रदर्शन आरटीएक्स ए4000 एडीए से 6% अधिक है, हालांकि, इस चेतावनी के साथ कि परीक्षण के परिणाम नियोजित विशिष्ट कार्य और परिचालन स्थितियों के आधार पर भिन्न हो सकते हैं।



आरटीएक्स ए 4000

बेंच मार्किंग

मॉडल औसत ट्रेन समय (एमएस)

प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_5 62.995805740356445
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_75 98.39066505432129
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_0 126.60405158996582
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_3 186.89460277557373
प्रशिक्षण डबल परिशुद्धता प्रकार resnet18 428.08079719543457
प्रशिक्षण डबल परिशुद्धता प्रकार resnet34 883.5790348052979
प्रशिक्षण डबल परिशुद्धता प्रकार resnet50 1016.3950300216675
प्रशिक्षण डबल परिशुद्धता प्रकार resnet101 1927.2308254241943
प्रशिक्षण डबल परिशुद्धता प्रकार resnet152 2815.663013458252
प्रशिक्षण डबल परिशुद्धता प्रकार resnext50_32x4d 1075.4373741149902
प्रशिक्षण डबल परिशुद्धता प्रकार resnext101_32x8d 4050.0641918182373
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट50_2 2615.9953451156616
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट101_2 5218.524832725525
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet121 751.9759511947632
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट169 910.3225564956665
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet201 1163.036551475525
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट161 2141.505298614502
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_0 203.988
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_1 98.04857730865479
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11 1697.7
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11_bn 1729.2972660064697
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13 2491.6
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13_bn 2545.34
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16 3371.68
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16_bn 3423.8639068603516
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19_bn 4314.55
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19 4249.422650337219
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_large 105.546
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_small 37.6680850982666
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x0_5 26.51611328125
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_0 61.260504722595215
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_5 105.30067920684814
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x2_0 181.03694438934326
अनुमान डबल परिशुद्धता प्रकार mnasnet0_5 17.397074699401855
अनुमान डबल परिशुद्धता प्रकार mnasnet0_75 28.902697563171387
अनुमान डबल परिशुद्धता प्रकार mnasnet1_0 38.3877
अनुमान डबल परिशुद्धता प्रकार mnasnet1_3 58.228821754455566
अनुमान डबल परिशुद्धता प्रकार resnet18 147.95727252960205
अनुमान डबल परिशुद्धता प्रकार resnet34 293.5
अनुमान डबल परिशुद्धता प्रकार resnet50 336.44991874694824
अनुमान डबल परिशुद्धता प्रकार resnet101 637.9982376098633
अनुमान डबल परिशुद्धता प्रकार resnet152 948.9351654052734
अनुमान डबल परिशुद्धता प्रकार resnext50_32x4d 372.80876636505127
अनुमान डबल परिशुद्धता प्रकार resnext101_32x8d 1385.09
अनुमान डबल परिशुद्धता प्रकार width_resnet50_2 873.048791885376
अनुमान डबल परिशुद्धता प्रकार width_resnet101_2 1729.2765426635742
अनुमान डबल परिशुद्धता प्रकार Densnet121 270.354
अनुमान डबल परिशुद्धता प्रकार डेंसनेट169 327.06
अनुमान डबल परिशुद्धता प्रकार Densnet201 414.733362197876
अनुमान डबल परिशुद्धता प्रकार डेंसनेट161 766.3542318344116
अनुमान डबल परिशुद्धता प्रकार स्क्वीज़नेट1_0 74.86292839050293
अनुमान डबल प्रिसिजन प्रकार स्क्वीज़नेट1_1 34.04905319213867
अनुमान डबल परिशुद्धता प्रकार vgg11 576.3767147064209
अनुमान डबल परिशुद्धता प्रकार vgg11_bn 580.5839586257935
अनुमान डबल परिशुद्धता प्रकार vgg13 853.4365510940552
अनुमान डबल परिशुद्धता प्रकार vgg13_bn 860.39
अनुमान डबल परिशुद्धता प्रकार vgg16 1145.091052055359
अनुमान डबल परिशुद्धता प्रकार vgg16_bn 1152.8028392791748
अनुमान डबल परिशुद्धता प्रकार vgg19_bn 1444.9562692642212
अनुमान डबल परिशुद्धता प्रकार vgg19 1437.0987701416016
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_large 30.8763
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_small 11.234536170959473
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x0_5 7.425284385681152
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_0 18.25782299041748
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_5 33.34946632385254
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x2_0 57.84676551818848


आरटीएक्स ए4000 एडीए


बेंच मार्किंग

मॉडल औसत ट्रेन समय

प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet0_5 20.2666
प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet0_75 21.445374488830566
प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet1_0 26.7625
प्रशिक्षण आधा परिशुद्धता प्रकार mnasnet1_3 26.57
प्रशिक्षण आधा परिशुद्धता प्रकार resnet18 19.624991416931152
प्रशिक्षण आधा परिशुद्धता प्रकार resnet34 32.46446132659912
प्रशिक्षण आधा परिशुद्धता प्रकार resnet50 57.332
प्रशिक्षण आधा परिशुद्धता प्रकार resnet101 98.209
प्रशिक्षण आधा परिशुद्धता प्रकार resnet152 138.967
प्रशिक्षण आधा परिशुद्धता प्रकार resnext50_32x4d 75.56005001068115
प्रशिक्षण आधा परिशुद्धता प्रकार resnext101_32x8d 228.8706636428833
प्रशिक्षण अर्ध परिशुद्धता प्रकार वाइड_रेसनेट50_2 113.76442432403564
प्रशिक्षण अर्ध परिशुद्धता प्रकार वाइड_रेसनेट101_2 204.838
प्रशिक्षण आधा परिशुद्धता प्रकार Densnet121 68.97401332855225
प्रशिक्षण अर्ध परिशुद्धता प्रकार डेंसनेट169 85.957
प्रशिक्षण आधा परिशुद्धता प्रकार Densnet201 103.299241065979
प्रशिक्षण अर्ध परिशुद्धता प्रकार डेंसनेट161 137.54578113555908
प्रशिक्षण अर्ध परिशुद्धता प्रकार स्क्वीज़नेट1_0 16.729
प्रशिक्षण अर्ध परिशुद्धता प्रकार स्क्वीज़नेट1_1 12.906527519226074
प्रशिक्षण आधा परिशुद्धता प्रकार vgg11 51.7004919052124
प्रशिक्षण आधा परिशुद्धता प्रकार vgg11_bn 57.63327598571777
प्रशिक्षण आधा परिशुद्धता प्रकार vgg13 86.809
प्रशिक्षण आधा परिशुद्धता प्रकार vgg13_bn 95.86676120758057
प्रशिक्षण आधा परिशुद्धता प्रकार vgg16 102.918
प्रशिक्षण आधा परिशुद्धता प्रकार vgg16_bn 113.74778270721436
प्रशिक्षण आधा परिशुद्धता प्रकार vgg19_bn 131.56734943389893
प्रशिक्षण आधा परिशुद्धता प्रकार vgg19 119.706
प्रशिक्षण आधा परिशुद्धता प्रकार mobilenet_v3_large 31.30636692047119
प्रशिक्षण आधा परिशुद्धता प्रकार mobilenet_v3_small 19.44464683532715
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x0_5 13.7766
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x1_0 23.608479499816895
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x1_5 26.793746948242188
प्रशिक्षण अर्ध परिशुद्धता प्रकार शफ़लनेट_v2_x2_0 24.550962448120117
अनुमान आधा परिशुद्धता प्रकार mnasnet0_5 4.4934
अनुमान आधा परिशुद्धता प्रकार mnasnet0_75 4.0253
अनुमान आधा परिशुद्धता प्रकार mnasnet1_0 4.42598819732666
अनुमान आधा परिशुद्धता प्रकार mnasnet1_3 4.6809
अनुमान आधा परिशुद्धता प्रकार resnet18 5.803341865539551
अनुमान आधा परिशुद्धता प्रकार resnet34 9.756693840026855
अनुमान आधा परिशुद्धता प्रकार resnet50 15.873079299926758
अनुमान आधा परिशुद्धता प्रकार resnet101 28.268003463745117
अनुमान आधा परिशुद्धता प्रकार resnet152 40.04594326019287
अनुमान आधा परिशुद्धता प्रकार resnext50_32x4d 19.53421115875244
अनुमान आधा परिशुद्धता प्रकार resnext101_32x8d 62.44826316833496
अनुमान आधा परिशुद्धता प्रकार width_resnet50_2 33.533992767333984
अनुमान आधा परिशुद्धता प्रकार width_resnet101_2 59.60897445678711
अनुमान आधा परिशुद्धता प्रकार Densnet121 18.052735328674316
अनुमान आधा परिशुद्धता प्रकार Densnet169 21.956982612609863
अनुमान आधा परिशुद्धता प्रकार Densnet201 27.851
अनुमान आधा परिशुद्धता प्रकार डेंसनेट161 37.414
अनुमान आधा परिशुद्धता प्रकार स्क्वीज़नेट1_0 4.3978
अनुमान आधा परिशुद्धता प्रकार स्क्वीज़नेट1_1 2.42833
अनुमान आधा परिशुद्धता प्रकार vgg11 17.623
अनुमान आधा परिशुद्धता प्रकार vgg11_bn 18.40585231781006
अनुमान आधा परिशुद्धता प्रकार vgg13 28.4386
अनुमान आधा परिशुद्धता प्रकार vgg13_bn 30.672597885131836
अनुमान आधा परिशुद्धता प्रकार vgg16 34.43562984466553
अनुमान आधा परिशुद्धता प्रकार vgg16_bn 36.929
अनुमान आधा परिशुद्धता प्रकार vgg19_bn 43.1406
अनुमान आधा परिशुद्धता प्रकार vgg19 40.5385684967041
अनुमान आधा परिशुद्धता प्रकार mobilenet_v3_large 5.3507
अनुमान आधा परिशुद्धता प्रकार mobilenet_v3_small 4.0512
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x0_5 5.0797
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x1_0 5.5935
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x1_5 5.649552345275879
अनुमान आधा परिशुद्धता प्रकार shufflenet_v2_x2_0 5.355663299560547
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_5 50.2386999130249
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet0_75 80.66896915435791
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_0 103.32422733306885
प्रशिक्षण डबल परिशुद्धता प्रकार mnasnet1_3 154.6230697631836
प्रशिक्षण डबल परिशुद्धता प्रकार resnet18 337.94031620025635
प्रशिक्षण डबल परिशुद्धता प्रकार resnet34 677.7706575393677
प्रशिक्षण डबल परिशुद्धता प्रकार resnet50 789.9243211746216
प्रशिक्षण डबल परिशुद्धता प्रकार resnet101 1484.3351316452026
प्रशिक्षण डबल परिशुद्धता प्रकार resnet152 2170.570478439331
प्रशिक्षण डबल परिशुद्धता प्रकार resnext50_32x4d 877.37
प्रशिक्षण डबल परिशुद्धता प्रकार resnext101_32x8d 3652.4944639205933
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट50_2 2154.6
प्रशिक्षण डबल प्रिसिजन टाइप वाइड_रेसनेट101_2 4176.522083282471
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet121 607.8699731826782
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट169 744.6409797668457
प्रशिक्षण डबल परिशुद्धता प्रकार Densnet201 962.677731513977
प्रशिक्षण डबल प्रिसिजन टाइप डेंसनेट161 1759.772515296936
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_0 164.3690824508667
प्रशिक्षण डबल प्रिसिजन टाइप स्क्वीज़नेट1_1 78.70647430419922
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11 1362.6095294952393
प्रशिक्षण डबल परिशुद्धता प्रकार vgg11_bn 1387.2539138793945
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13 2006.0230445861816
प्रशिक्षण डबल परिशुद्धता प्रकार vgg13_bn 2047.526364326477
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16 2702.2086429595947
प्रशिक्षण डबल परिशुद्धता प्रकार vgg16_bn 2747.241234779358
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19_bn 3447.34
प्रशिक्षण डबल परिशुद्धता प्रकार vgg19 3397.990345954895
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_large 84.65698719024658
प्रशिक्षण डबल परिशुद्धता प्रकार mobilenet_v3_small 29.8617
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x0_5 27.4073
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_0 48.322744369506836
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x1_5 82.224
प्रशिक्षण डबल परिशुद्धता प्रकार शफ़लनेट_v2_x2_0 141.7021369934082
अनुमान डबल परिशुद्धता प्रकार mnasnet0_5 12.988653182983398
अनुमान डबल परिशुद्धता प्रकार mnasnet0_75 22.4228
अनुमान डबल परिशुद्धता प्रकार mnasnet1_0 30.056486129760742
अनुमान डबल परिशुद्धता प्रकार mnasnet1_3 46.953935623168945
अनुमान डबल परिशुद्धता प्रकार resnet18 118.04479122161865
अनुमान डबल परिशुद्धता प्रकार resnet34 231.52336597442627
अनुमान डबल परिशुद्धता प्रकार resnet50 268.63497734069824
अनुमान डबल परिशुद्धता प्रकार resnet101 495.20
अनुमान डबल परिशुद्धता प्रकार resnet152 726.4922094345093
अनुमान डबल परिशुद्धता प्रकार resnext50_32x4d 291.47679328918457
अनुमान डबल परिशुद्धता प्रकार resnext101_32x8d 1055.
अनुमान डबल परिशुद्धता प्रकार width_resnet50_2 690.69
अनुमान डबल परिशुद्धता प्रकार width_resnet101_2 1347.5529861450195
अनुमान डबल परिशुद्धता प्रकार Densnet121 224.35829639434814
अनुमान डबल परिशुद्धता प्रकार डेंसनेट169 268.94
अनुमान डबल परिशुद्धता प्रकार Densnet201 343.51
अनुमान डबल परिशुद्धता प्रकार डेंसनेट161 635.866231918335
अनुमान डबल परिशुद्धता प्रकार स्क्वीज़नेट1_0 61.92759037017822
अनुमान डबल प्रिसिजन प्रकार स्क्वीज़नेट1_1 27.0094
अनुमान डबल परिशुद्धता प्रकार vgg11 462.3375129699707
अनुमान डबल परिशुद्धता प्रकार vgg11_bn 468.4495782852173
अनुमान डबल परिशुद्धता प्रकार vgg13 692.82
अनुमान डबल परिशुद्धता प्रकार vgg13_bn 703.3538103103638
अनुमान डबल परिशुद्धता प्रकार vgg16 924.4353818893433
अनुमान डबल परिशुद्धता प्रकार vgg16_bn 936.5075063705444
अनुमान डबल परिशुद्धता प्रकार vgg19_bn 1169.098300933838
अनुमान डबल परिशुद्धता प्रकार vgg19 1156.3771772384644
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_large 24.2356014251709
अनुमान डबल परिशुद्धता प्रकार mobilenet_v3_small 8.85490894317627
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x0_5 6.360034942626953
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_0 14.3054
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x1_5 24.863481521606445
अनुमान डबल परिशुद्धता प्रकार shufflenet_v2_x2_0 43.8505744934082


निष्कर्ष

नया ग्राफ़िक्स कार्ड कई कार्य कार्यों के लिए एक प्रभावी समाधान साबित हुआ है। अपने कॉम्पैक्ट आकार के कारण, यह शक्तिशाली SFF (स्मॉल फॉर्म फैक्टर) कंप्यूटर के लिए आदर्श है। साथ ही, यह उल्लेखनीय है कि 160-बिट बस के साथ 6,144 CUDA कोर और 20GB मेमोरी इस कार्ड को बाज़ार में सबसे अधिक उत्पादक में से एक बनाती है। इसके अलावा, 70W का कम टीडीपी बिजली की खपत लागत को कम करने में मदद करता है। चार मिनी-डिस्प्लेपोर्ट पोर्ट कार्ड को कई मॉनिटरों के साथ या मल्टी-चैनल ग्राफिक्स समाधान के रूप में उपयोग करने की अनुमति देते हैं।


आरटीएक्स 4000 एसएफएफ एडीए पिछली पीढ़ियों की तुलना में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है, जो दोगुनी बिजली खपत वाले कार्ड के बराबर प्रदर्शन प्रदान करता है। बिना PCIe पावर कनेक्टर के, RTX 4000 SFF ADA को उच्च प्रदर्शन से समझौता किए बिना कम-पावर वर्कस्टेशन में एकीकृत करना आसान है।
바카라사이트 바카라사이트 온라인바카라