एआई स्टार्टअप पेरप्लेक्सिटी कथित तौर पर उन वेबसाइटों से सामग्री को रेंगने और स्क्रैप कर रही है, जिन्होंने स्पष्ट रूप से कहा है कि वे स्क्रैप नहीं करना चाहते हैं।
सोमवार को, एक इंटरनेट इन्फ्रास्ट्रक्चर प्रदाता, क्लाउडफ्लारे ने एक शोध ब्लॉग प्रकाशित किया, जिसमें कहा गया था कि यह एआई स्टार्टअप का अवलोकन करता है, सीईओ अरविंद श्रीनिवास द्वारा सह-स्थापना और नेतृत्व किया, उन वेबसाइटों पर अपनी क्रॉलिंग और स्क्रैपिंग गतिविधियों को छिपाने के लिए भ्रामक तरीकों का उपयोग किया।
पेरप्लेक्सिटी के खिलाफ क्या आरोप हैं?
नेटवर्क इन्फ्रास्ट्रक्चर दिग्गज ने कहा रिपोर्ट यह स्पष्टता शुरू में अपने घोषित उपयोगकर्ता एजेंट से रेंगती है, लेकिन जब इसे एक नेटवर्क ब्लॉक के साथ प्रस्तुत किया जाता है, तो एआई अपनी रेंगने वाली पहचान को “वेबसाइट की वरीयताओं को दरकिनार करने के प्रयास में” करता है।
एआई उत्पाद जैसे कि पेरप्लेक्सिटी द्वारा पेश किए गए लोग अक्सर इंटरनेट से बड़ी मात्रा में डेटा को स्क्रैप करने पर भरोसा करते हैं। एक के अनुसार रॉयटर्स रिपोर्ट, कई एआई फर्मों ने पाठ, छवियों और वीडियो को खुरचाया, मूल प्रकाशक द्वारा निर्धारित वेब मानकों को दरकिनार करते हुए।
क्लाउडफ्लेयर ने कहा कि अपने ग्राहकों के ग्राहकों की शिकायत के बाद स्थिति सामने आई थी कि पेरप्लेक्सिटी अभी भी अपनी सामग्री तक पहुंचने में सक्षम थी, भले ही वे अपने रोबोट्स में नियम जोड़े।
इस बात की पुष्टि करने के बाद कि Perplexity के क्रॉलर वास्तव में उन साइटों से अवरुद्ध थे, CloudFlare ने जांच करने और AI स्टार्टअप के ‘अनधिकृत’ व्यवहार की पुष्टि करने के लिए परीक्षण किए।
“यह गतिविधि प्रति दिन हजारों डोमेन और लाखों अनुरोधों में देखी गई थी। हम इस क्रॉलर को फिंगरप्रिंट करने में सक्षम थे। यंत्र अधिगम और नेटवर्क सिग्नल, ”द क्लाउडफ्लेयर की पोस्ट ने कहा।
आरोपों के प्रति प्रतिक्रिया जवाब देती है
एआई स्टार्टअप ने आरोपों का खंडन करने के लिए मंगलवार को एक्स (पूर्व में ट्विटर) में लिया। “इस मुद्दे के आसपास की धमाके से पता चलता है कि क्लाउडफ्लेयर का नेतृत्व या तो खतरनाक रूप से गलत है। एआई की मूल बातेंया बस बादल की तुलना में अधिक स्वभाव। ”
पेरप्लेक्सिटी ने एक अन्य एक्स पोस्ट में डेटा स्क्रैपिंग के पीछे पूरे तर्क और प्रक्रिया को भी समझाया।
यह दावा किया कि उनके डेटा को स्क्रैप करने का तरीका है
“मौलिक रूप से पारंपरिक वेब रेंगने से अलग है, जिसमें क्रॉलर बड़े पैमाने पर डेटाबेस बनाने के लिए लाखों पृष्ठों पर व्यवस्थित रूप से यात्रा करते हैं, चाहे किसी ने उस विशिष्ट जानकारी के लिए पूछा हो या नहीं।”
इसने यह कहकर अपने कार्यों को और सही ठहराया, “उपयोगकर्ता द्वारा संचालित एजेंट, इसके विपरीत, केवल सामग्री प्राप्त करें जब कोई वास्तविक व्यक्ति कुछ विशिष्ट अनुरोध करता है, और वे उस सामग्री का उपयोग तुरंत उपयोगकर्ता के प्रश्न का उत्तर देने के लिए करते हैं। Perplexity के उपयोगकर्ता-चालित एजेंट जानकारी को संग्रहीत नहीं करते हैं या इसके साथ ट्रेन नहीं करते हैं।”
Perplexity द्वारा दिया गया मुख्य संदेश यह है कि उपयोगकर्ता द्वारा संचालित AI एजेंट उपयोगकर्ताओं की ओर से कार्य करते हैं, न कि बॉट्स और इन्फ्रास्ट्रक्चर प्रदाताओं जैसे क्लाउडफ्लेयर जैसे कि एक खुले और सुलभ वेब को संरक्षित करने के लिए इस अंतर को समझना और समायोजित करना चाहिए।

