ठूलो डाटा कसले र किन सङ्कलन गर्छ?

2019 को पतनमा, एप्पल कार्ड सेवाको साथ एक स्क्यान्डल फैलियो: दर्ता गर्दा, यसले पुरुष र महिलाहरूको लागि फरक क्रेडिट सीमा जारी गर्यो। स्टीव वोज्नियाक पनि भाग्यबाट बाहिर थिए:

एक वर्ष अघि, यो खुलासा भएको थियो कि नेटफ्लिक्स प्लेटफर्मले प्रयोगकर्ताहरूलाई तिनीहरूको लिङ्ग, उमेर र राष्ट्रियताको आधारमा फरक-फरक पोस्टर र टिजरहरू देखाउँछ। यसका लागि सेवालाई जातिवादको आरोप लगाइएको थियो।

अन्तमा, फेसबुकले आफ्ना प्रयोगकर्ताहरूको डाटा संकलन, बिक्री र हेरफेर गरेको आरोपमा मार्क जुकरबर्गलाई नियमित रूपमा गाली गरिन्छ। वर्षौंको दौडान, उनीमाथि अमेरिकी चुनावको समयमा हेरफेर गर्ने, रूसी विशेष सेवाहरूलाई सहयोग गर्ने, घृणा र कट्टरपन्थी विचारहरूलाई उक्साउने, अनुपयुक्त विज्ञापन गर्ने, प्रयोगकर्ताको डाटा लीक गर्ने, पेडोफाइलहरू विरुद्धको अनुसन्धानमा बाधा पुर्‍याउने आरोप लगाइएको थियो।

zuck द्वारा फेसबुक पोस्ट

उही समयमा, पोर्नहब अनलाइन सेवाले विभिन्न राष्ट्रियता, लिङ्ग र उमेरका व्यक्तिहरूले कस्तो प्रकारको पोर्न खोजिरहेका छन् भन्ने बारे रिपोर्टहरू वार्षिक रूपमा प्रकाशित गर्दछ। र केहि कारण को लागी यो कसैलाई परेशान गर्दैन। यद्यपि यी सबै कथाहरू समान छन्: तिनीहरूमध्ये प्रत्येकमा हामी ठूलो डाटासँग काम गरिरहेका छौं, जुन XNUMX औं शताब्दीमा "नयाँ तेल" भनिन्छ।

ठूलो डाटा के हो

बिग डाटा - तिनीहरू पनि ठूला डाटा (eng. बिग डाटा) वा मेटाडेटा हुन् - डाटाको एर्रे हो जुन नियमित रूपमा र ठूलो मात्रामा आउँछ। तिनीहरू सङ्कलन, प्रशोधन र विश्लेषण गरिन्छ, स्पष्ट मोडेल र ढाँचाहरूको परिणामस्वरूप।

एउटा उल्लेखनीय उदाहरण लार्ज ह्याड्रन कोलाइडरको डाटा हो, जुन लगातार र ठूलो मात्रामा आउँछ। तिनीहरूको सहयोगमा, वैज्ञानिकहरूले धेरै समस्याहरू समाधान गर्छन्।

तर वेबमा ठूलो डाटा भनेको वैज्ञानिक अनुसन्धानका लागि तथ्याङ्क मात्र होइन। तिनीहरू विभिन्न समूह र राष्ट्रियताका प्रयोगकर्ताहरू कसरी व्यवहार गर्छन्, उनीहरूले केमा ध्यान दिन्छन् र उनीहरूले सामग्रीसँग कसरी अन्तरक्रिया गर्छन् भनेर ट्र्याक गर्न प्रयोग गर्न सकिन्छ। कहिलेकाहीँ, यसका लागि, डेटा एक स्रोतबाट होइन, तर धेरैबाट, तुलना र निश्चित ढाँचाहरू पहिचान गरी सङ्कलन गरिन्छ।

नेटवर्कमा ठूलो डाटा कत्तिको महत्त्वपूर्ण छ भन्ने बारे, तिनीहरूले कुरा गर्न थाले जब त्यहाँ वास्तवमै धेरै थियो। २०२० को सुरुमा, विश्वमा ४.५ बिलियन इन्टरनेट प्रयोगकर्ता थिए, जसमध्ये ३.८ बिलियन सामाजिक सञ्जालमा दर्ता भएका थिए।

जसको बिग डाटामा पहुँच छ

सर्वेक्षणहरूका अनुसार, हाम्रा आधा भन्दा बढी देशहरूले विश्वास गर्छन् कि नेटवर्कमा उनीहरूको डाटा तेस्रो पक्षहरूद्वारा प्रयोग गरिन्छ। एकै समयमा, धेरैले व्यक्तिगत जानकारी, फोटोहरू, र सामाजिक सञ्जाल र अनुप्रयोगहरूमा फोन नम्बर पनि पोस्ट गर्छन्।

ठूलो डाटा कसले र किन सङ्कलन गर्छ?
ठूलो डाटा कसले र किन सङ्कलन गर्छ?
ठूलो डाटा कसले र किन सङ्कलन गर्छ?
ठूलो डाटा कसले र किन सङ्कलन गर्छ?

यसलाई यहाँ व्याख्या गर्न आवश्यक छ: पहिलो व्यक्ति आफै प्रयोगकर्ता हो, जसले यसको डेटा कुनै पनि स्रोत वा अनुप्रयोगमा राख्छ। एकै समयमा, उहाँ सहमत हुनुहुन्छ (सम्झौतामा टिक राख्छ) यो डाटाको प्रशोधन गर्न दोस्रो पक्ष - त्यो हो, स्रोत को मालिक. तेस्रो पक्ष भनेको ती हो जसलाई स्रोतका मालिकहरूले प्रयोगकर्ता डेटा स्थानान्तरण वा बेच्न सक्छन्। प्रायः यो प्रयोगकर्ता सम्झौतामा लेखिएको छ, तर सधैं होइन।

तेस्रो पक्ष सरकारी एजेन्सीहरू, ह्याकरहरू वा व्यवसायिक उद्देश्यका लागि डाटा खरिद गर्ने कम्पनीहरू हुन्। पूर्वले अदालत वा उच्च अधिकारीको निर्णयबाट डाटा प्राप्त गर्न सक्छ। ह्याकरहरू, निस्सन्देह, कुनै पनि अनुमतिहरू प्रयोग गर्दैनन् - तिनीहरू केवल सर्भरहरूमा भण्डारण गरिएका डाटाबेसहरू ह्याक गर्छन्। कम्पनीहरूले (कानून अनुसार) डेटा पहुँच गर्न सक्छन् यदि तपाईंले आफैले तिनीहरूलाई अनुमति दिनुभएको छ - सम्झौता अन्तर्गत बाकस जाँच गरेर। अन्यथा, यो अवैध छ।

कम्पनीहरूले किन प्रयोग गर्छन् बिग डाटा?

व्यावसायिक क्षेत्रमा बिग डाटा दशकौंदेखि प्रयोग भइरहेको छ, यो अहिलेको जस्तो तीव्र थिएन। यी हुन्, उदाहरणका लागि, निगरानी क्यामेराहरूबाट रेकर्डहरू, GPS नेभिगेटरहरूबाट डाटा वा अनलाइन भुक्तानीहरू। अब, सामाजिक सञ्जालहरू, अनलाइन सेवाहरू र अनुप्रयोगहरूको विकासको साथ, यी सबै जडान गर्न सकिन्छ र सबैभन्दा पूर्ण तस्विर प्राप्त गर्न सकिन्छ: सम्भावित ग्राहकहरू कहाँ बस्छन्, उनीहरू के हेर्न मन पराउँछन्, उनीहरू छुट्टीमा कहाँ जान्छन् र उनीहरूसँग कुन ब्रान्डको कार छ।

माथिका उदाहरणहरूबाट, यो स्पष्ट छ कि ठूलो डाटाको सहयोगमा, कम्पनीहरू, सबै भन्दा पहिले, विज्ञापनहरू लक्षित गर्न चाहन्छन्। त्यो हो, उत्पादनहरू, सेवाहरू वा व्यक्तिगत विकल्पहरू सही दर्शकहरूलाई मात्र प्रस्ताव गर्न र एक विशिष्ट प्रयोगकर्ताको लागि उत्पादन अनुकूलन गर्न। थप रूपमा, फेसबुक र अन्य ठूला प्लेटफर्महरूमा विज्ञापनहरू झन्-झन् महँगो हुँदै गइरहेको छ, र यसलाई पङ्क्तिमा सबैलाई देखाउनु कुनै पनि लाभदायक छैन।

खुला स्रोतहरूबाट सम्भावित ग्राहकहरूको बारेमा जानकारी बीमा कम्पनीहरू, निजी क्लिनिकहरू र रोजगारदाताहरू द्वारा सक्रिय रूपमा प्रयोग गरिन्छ। उदाहरणका लागि, पहिलेकाले बीमाका सर्तहरू परिवर्तन गर्न सक्छन् यदि उनीहरूले तपाइँ प्रायः केहि रोग वा औषधिहरूको बारेमा जानकारी खोज्दै हुनुहुन्छ भने, र रोजगारदाताहरूले तपाइँ द्वन्द्व र असामाजिक व्यवहारको खतरामा हुनुहुन्छ कि छैन भनेर मूल्याङ्कन गर्न सक्नुहुन्छ।

तर हालैका वर्षहरूमा संघर्ष गरिरहेको अर्को महत्त्वपूर्ण कार्य छ: सबैभन्दा विलायक दर्शकहरूको नजिक पुग्न। यो गर्न त्यति सजिलो छैन, यद्यपि कार्य एकल OFD (वित्तीय डेटा अपरेटर) मार्फत भुक्तानी सेवाहरू र इलेक्ट्रोनिक जाँचहरूद्वारा महत्त्वपूर्ण रूपमा सहज भएको छ। सकेसम्म नजिक हुनको लागि, कम्पनीहरूले बाल्यकालदेखि नै सम्भावित ग्राहकहरूलाई ट्र्याक गर्न र "पालन" गर्ने प्रयास गर्छन्।: अनलाइन खेलहरू, अन्तरक्रियात्मक खेलौनाहरू र शैक्षिक सेवाहरू मार्फत।

यस्ले कसरी काम गर्छ?

डाटा सङ्कलनका लागि सबैभन्दा ठूलो अवसरहरू एकै पटक धेरै सेवाहरूको स्वामित्व लिने विश्वव्यापी निगमहरू हुन्। फेसबुकका अहिले २.५ बिलियनभन्दा बढी सक्रिय प्रयोगकर्ता छन्। एकै समयमा, कम्पनीसँग अन्य सेवाहरू पनि छन्: इन्स्टाग्राम - 2,5 बिलियन भन्दा बढी, व्हाट्सएप - 1 बिलियन भन्दा बढी र अन्य।

तर गुगलको अझ बढी प्रभाव छ: जीमेल विश्वमा १,५ बिलियन मानिसले प्रयोग गर्दछ, अर्को २,५ बिलियन एन्ड्रोइड मोबाइल ओएस द्वारा, २ बिलियन भन्दा बढी युट्युबले प्रयोग गर्दछ। र त्यो गुगल खोज र गुगल नक्सा अनुप्रयोगहरू, गुगल प्ले स्टोर, र क्रोम ब्राउजर गणना गर्दैन। यो तपाईंको अनलाइन बैंकलाई बाँध्न बाँकी छ - र Google ले तपाईंको बारेमा शाब्दिक रूपमा सबै कुरा जान्न सक्षम हुनेछ। वैसे, Yandex यस सन्दर्भमा पहिले नै एक कदम अगाडी छ, तर यो केवल रूसी-भाषी दर्शकहरूलाई समेट्छ।



???? सबैभन्दा पहिले, कम्पनीहरूले हामीले के पोस्ट गर्छौं र सामाजिक सञ्जालहरूमा मनपर्छ त्यसमा रुचि राख्छन्। उदाहरणका लागि, यदि बैंकले तपाईं विवाहित हुनुहुन्छ र इन्स्टाग्राम वा टिन्डरमा केटीहरूलाई सक्रिय रूपमा मन पराउँदै हुनुहुन्छ भन्ने देख्छ भने, तपाईंले उपभोक्ता ऋण अनुमोदन गर्ने सम्भावना बढी हुन्छ। र परिवारमा धितो गयो।

यो पनि महत्त्वपूर्ण छ कि तपाइँ कुन विज्ञापनहरूमा क्लिक गर्नुहुन्छ, कति पटक र कस्तो परिणामको साथ।

(अर्थात) अर्को चरण निजी सन्देशहरू हो: तिनीहरूले धेरै जानकारी समावेश गर्दछ। सन्देशहरू VKontakte, Facebook, WhatsApp र अन्य इन्स्ट्यान्ट मेसेन्जरहरूमा लीक गरिएको थियो। उनीहरुका अनुसार मेसेज पठाउँदा जियोलोकेशन ट्र्याक गर्न सजिलो हुन्छ । तपाईंले पक्कै पनि याद गर्नुभएको छ: जब तपाईं केहि किन्ने वा कसैसँग पिज्जा अर्डर गर्ने बारे छलफल गर्नुहुन्छ, सान्दर्भिक विज्ञापन तुरुन्तै फिडमा देखा पर्दछ।

🚕 बिग डाटा सक्रिय रूपमा प्रयोग गरिन्छ र डेलिभरी र ट्याक्सी सेवाहरू द्वारा "लीक" हुन्छ। तपाईं कहाँ बस्नुहुन्छ र काम गर्नुहुन्छ, तपाईंलाई के मन पर्छ, तपाईंको अनुमानित आम्दानी के हो भन्ने कुरा उनीहरूलाई थाहा छ। Uber, उदाहरणका लागि, यदि तपाईं बारबाट घरमा ड्राइभ गर्दै हुनुहुन्छ र स्पष्ट रूपमा ओभरडन हुनुहुन्छ भने मूल्य बढी देखाउँछ। र जब तपाईंसँग तपाईंको फोनमा अन्य एग्रीगेटरहरूको गुच्छा छ, यसको विपरित, तिनीहरूले सस्तो प्रस्ताव गर्नेछन्।

(अर्थात) सम्भव भएसम्म धेरै जानकारी सङ्कलन गर्न फोटो र भिडियोहरू प्रयोग गर्ने सेवाहरू छन्। उदाहरणका लागि, कम्प्युटर भिजन लाइब्रेरीहरू - गुगलसँग एउटा छ। तिनीहरूले तपाइँ र तपाइँको वरपर स्क्यान गर्न को लागी तपाइँ कुन आकार वा उचाई हुनुहुन्छ, तपाइँ कुन ब्रान्डको पहिरन लगाउनुहुन्छ, तपाइँ कुन कार चलाउनुहुन्छ, तपाइँसँग बच्चाहरु वा घरपालुवा जनावरहरू छन्।

(अर्थात) बैंकहरूलाई आफ्नो मेलिङका लागि एसएमएस गेटवे प्रदान गर्नेहरूले कार्डमा तपाईंको खरिदहरू ट्र्याक गर्न सक्छन् - अन्तिम 4 अंक र फोन नम्बर थाहा छ - र त्यसपछि यो डेटा अरू कसैलाई बेच्नुहोस्। त्यसैले उपहारको रूपमा छुट र पिज्जाको साथ यो सबै स्प्याम।

🤷️️ अन्तमा, हामी आफैले बायाँ सेवाहरू र अनुप्रयोगहरूमा हाम्रो डाटा लीक गर्छौं। Getcontact को वरिपरिको त्यो प्रचार याद गर्नुहोस्, जब सबैजना आफ्नो फोन नम्बर भर्न पाउँदा खुसी थिए कि यो अरूले कसरी लेखेका थिए। र अब तिनीहरूको सम्झौता फेला पार्नुहोस् र पढ्नुहोस् यसले तपाईंको डाटाको स्थानान्तरणको बारेमा के भन्छ (स्पोइलर: मालिकहरूले तिनीहरूलाई आफ्नो विवेकमा तेस्रो पक्षहरूमा स्थानान्तरण गर्न सक्छन्):

ठूलो डाटा कसले र किन सङ्कलन गर्छ?

कर्पोरेसनहरूले सफलतापूर्वक प्रयोगकर्ता डेटा वर्षौंसम्म सङ्कलन गर्न र बेच्न पनि सक्छन्, जबसम्म यो मुद्दामा नआउने - जस्तै फेसबुकसँग भयो। र त्यसपछि निर्णायक भूमिका कम्पनीको GDPR को उल्लङ्घनले खेलेको थियो - EU मा एक कानून जसले डेटाको प्रयोगलाई अमेरिकी भन्दा धेरै कडाइका साथ प्रतिबन्धित गर्दछ। अर्को भर्खरको उदाहरण अवास्ट एन्टिभाइरस स्क्यान्डल हो: कम्पनीको सहायक सेवाहरू मध्ये एकले 100 देखि 400 मिलियन प्रयोगकर्ताहरूको डाटा संकलन र बेचेको छ।

तर के यी सबैले हाम्रो लागि कुनै फाइदा छ?

कति ठूलो डाटाले हामी सबैलाई मद्दत गर्छ?

हो, त्यहाँ एक उज्ज्वल पक्ष पनि छ।

बिग डाटाले अपराधीहरूलाई पक्रन र आतंकवादी हमलाहरू रोक्न, हराएका बालबालिकाहरू फेला पार्न र तिनीहरूलाई खतराबाट जोगाउन मद्दत गर्छ।

उनीहरुको सहयोगमा हामीले हामीले बैंकहरू र व्यक्तिगत छुटहरूबाट राम्रो प्रस्तावहरू प्राप्त गर्दछौं। उहाँहरूलाई हामी धन्यवाद दिन्छौं हामी धेरै सेवाहरू र सामाजिक सञ्जालहरूको लागि भुक्तान गर्दैनौं जुन केवल विज्ञापनमा कमाइन्छ। अन्यथा, इन्स्टाग्रामले मात्र हामीलाई महिनामा हजारौं डलर खर्च गर्नेछ।

फेसबुकका मात्र २.४ बिलियन सक्रिय प्रयोगकर्ता छन् । एकै समयमा, 2,4 को लागि तिनीहरूको नाफा $ 2019 बिलियन थियो। यो बाहिर जान्छ कि कम्पनीले विज्ञापन मार्फत प्रत्येक प्रयोगकर्ताबाट $ 18,5 प्रति वर्ष कमाउँछ।

अन्तमा, कहिलेकाहीँ यो केवल सुविधाजनक छ: जब सेवाहरूलाई पहिले नै थाहा हुन्छ कि तपाईं कहाँ हुनुहुन्छ र के चाहनुहुन्छ, र तपाईंले आफैलाई आवश्यक जानकारी खोज्नु पर्दैन।

बिग डाटा को लागी अर्को आशाजनक क्षेत्र शिक्षा हो।

भर्जिनियाको एक अमेरिकी विश्वविद्यालयमा तथाकथित जोखिम समूहका विद्यार्थीहरूको तथ्याङ्क सङ्कलन गर्न एउटा अध्ययन गरिएको थियो। यी ती हुन् जो कम पढ्छन्, कक्षा छुटाउँछन् र छोड्न लागेका छन्। तथ्य यो हो कि राज्यहरूमा हरेक वर्ष लगभग 400 व्यक्ति कटौती गरिन्छ। यो दुबै विश्वविद्यालयहरूको लागि नराम्रो छ, जसको मूल्याङ्कन घटेको छ र तिनीहरूको कोष कटौती गरिएको छ, र विद्यार्थीहरू आफैंका लागि: धेरैले शिक्षाको लागि ऋण लिन्छन्, जुन कटौती पछि, अझै पनि तिर्नु पर्छ। हराएको समय र क्यारियर सम्भावनाहरू उल्लेख नगर्नुहोस्। ठूला डाटाको मद्दतले, समयमै पछि परेकाहरूलाई पहिचान गर्न र उनीहरूलाई शिक्षक, थप कक्षाहरू र अन्य लक्षित सहायता प्रदान गर्न सम्भव छ।

यो, वैसे, स्कूलहरूको लागि पनि उपयुक्त छ: त्यसपछि प्रणालीले शिक्षक र आमाबाबुलाई सूचित गर्नेछ - तिनीहरू भन्छन्, बच्चाको समस्या छ, हामी सँगै उहाँलाई मद्दत गरौं। बिग डाटाले तपाईंलाई कुन पाठ्यपुस्तकहरूले राम्रो काम गर्छ र कुन शिक्षकहरूले सामग्रीलाई अझ सजिलै व्याख्या गर्छन् भनेर बुझ्न मद्दत गर्नेछ।

अर्को सकारात्मक उदाहरण क्यारियर प्रोफाइलिंग हो।: यो तब हुन्छ जब किशोरहरूलाई उनीहरूको भविष्यको पेशाको बारेमा निर्णय गर्न मद्दत गरिन्छ। यहाँ, ठूलो डेटाले तपाईंलाई जानकारी सङ्कलन गर्न अनुमति दिन्छ जुन परम्परागत परीक्षणहरू प्रयोग गरेर प्राप्त गर्न सकिँदैन: प्रयोगकर्ताले कसरी व्यवहार गर्छ, उसले केमा ध्यान दिन्छ, उसले सामग्रीसँग कसरी अन्तरक्रिया गर्छ।

उही संयुक्त राज्य अमेरिका मा, त्यहाँ एक क्यारियर मार्गदर्शन कार्यक्रम छ - SC ACCELERATE। यसले, अन्य चीजहरूको बीचमा, CareerChoice GPS टेक्नोलोजी प्रयोग गर्दछ: तिनीहरूले विद्यार्थीहरूको प्रकृति, विषयहरूमा उनीहरूको झुकाव, शक्ति र कमजोरीहरूको बारेमा डेटा विश्लेषण गर्दछ। डाटा त्यसपछि किशोर किशोरीहरूलाई उनीहरूका लागि सही कलेजहरू छनौट गर्न मद्दत गर्न प्रयोग गरिन्छ।


सदस्यता लिनुहोस् र Yandex.Zen मा हामीलाई पछ्याउनुहोस् — प्रविधि, नवीनता, अर्थशास्त्र, शिक्षा र एउटै च्यानलमा साझेदारी।

जवाफ छाड्नुस्