เว็บแทงบอลยูฟ่า ทายผลบอล พร้อมโปรโมชั่นให้ท่านมากมาย

เว็บแทงบอลยูฟ่า พร้อมโปรโมชั่นให้ท่านมากมาย แม้ว่าจะมีการพูดคุยกันอย่างกว้างขวางถึงผลกระทบของต้นทุนทางการเงินที่มีต่อการตัดสินใจ การวิจัยยังคงกระจัดกระจาย และบางครั้งผลลัพธ์ก็ขัดแย้งกัน เหตุผลหนึ่งสำหรับภาพที่ไม่สมบูรณ์นี้คือความแตกต่างที่ขาดหายไประหว่างผลกระทบของต้นทุนที่จมต่อการใช้งานและการตัดสินใจเกี่ยวกับความคืบหน้าและผู้กลั่นกรองที่เกี่ยวข้อง บทความนี้นำเสนอผลลัพธ์ของการทบทวนการวิเคราะห์เมตาของขนาดเอฟเฟกต์ 98 ขนาดของเอฟเฟกต์จม-ต้นทุน โดยเน้นเป็นพิเศษที่อิทธิพลเฉพาะการตัดสินใจของผู้กลั่นกรอง ผลลัพธ์แสดงหลักฐานที่ชัดเจนว่าผลกระทบจากต้นทุนจมเกิดขึ้น แม้ว่าขนาดผลกระทบและอิทธิพลของผู้กลั่นกรองจะขึ้นอยู่กับประเภทการตัดสินใจที่เกี่ยวข้อง โดยเฉพาะอย่างยิ่ง เราพบการสนับสนุนสำหรับแนวคิดที่ว่าผลกระทบของต้นทุนจมถูกลดทอนลงตามเวลาในการตัดสินใจใช้งาน

บทนำตัวอย่างของผลกระทบของต้นทุนที่ลดลงต่อการตัดสินใจไม่ได้ปรากฏเฉพาะในการตัดสินใจขององค์กรเท่านั้น แต่ยังรวมถึงการตัดสินใจในชีวิตประจำวันด้วย ตัวอย่างเช่น ลองนึกภาพว่าคุณซื้อตั๋วสำหรับการแสดงที่โรงละครใกล้บ้านคุณ สองสามวันต่อมา เพื่อนที่ดีโทรมาและเชิญคุณไปทานอาหารเย็นแบบอิตาลีมื้อพิเศษในตอนเย็นของการแสดง แม้ว่าคุณต้องการที่จะเข้าร่วมงานเลี้ยงอาหารค่ำ แต่ความคิดของคุณเกี่ยวกับราคาตั๋วโรงละครที่จ่ายไปแล้วและคุณตัดสินใจเข้าร่วมการแสดง ตัวอย่างของผลกระทบของต้นทุนที่ลดลงต่อการตัดสินใจขององค์กร ได้แก่ การลงทุนด้านการวิจัยและพัฒนา เช่น การพัฒนาเครื่องบิน Concorde ความเร็วเหนือเสียง ในช่วงเริ่มต้นของการพัฒนา เครื่องบินมีราคาแพงกว่าที่คาดไว้อย่างมาก และความสำเร็จทางการเงินของโครงการยังไม่ชัดเจน อย่างไรก็ตาม โครงการยังไม่หยุด2542 , น. 591)

เมื่อมองแวบแรก สถานการณ์การตัดสินใจที่แตกต่างกันทั้งสองนี้มีประเด็นสำคัญร่วมกัน: ในทั้งสองสถานการณ์ มีการใช้เงินที่กู้คืนไม่ได้และ “ต้นทุนลดลง” ตามทฤษฎีเศรษฐศาสตร์จุลภาค ผู้คนควรตัดสินใจบนพื้นฐานของผลประโยชน์และต้นทุนในปัจจุบันและอนาคตเท่านั้น แต่บางครั้งผู้มีอำนาจตัดสินใจเบี่ยงเบนไปจากหลักการพื้นฐานของทฤษฎีเศรษฐศาสตร์จุลภาคและคำนึงถึงต้นทุนที่ลดลง ผลกระทบของต้นทุนจมที่ได้รับการตรวจสอบในหลากหลายสาขาวิชา รวมถึงจิตวิทยา (เช่น Astebro et al. 2007 ; Strough et al. 2008 ) สังคมวิทยา (เช่น Janssen et al. 2003 ) การจัดการ (เช่น Conlon และ Garland 1993 ; Keil et al. 2000 ), การตลาด (เช่น Soman and Cheema 2001; Soman and Gourville 2001 ), เศรษฐศาสตร์อุตสาหกรรม (เช่น Manez et al. 2009 ) และการเงิน (เช่น Guler 2007 ) ด้วยเหตุนี้ สถานการณ์ที่สังเกตผลกระทบจากต้นทุนจมจึงแตกต่างกันอย่างมากเช่นกัน แม้ว่าเราจะพิจารณาการตัดสินใจทางเศรษฐกิจที่แต่ละคนตอบสนองต่อการลงทุนทางการเงินที่ผ่านมา เราก็พบเพียงสองกระแสการวิจัยที่แตกต่างกันในวรรณกรรมทางวิชาการ ดังนั้น ดวงจันทร์ ( พ.ศ. 2544)) เรียกร้องให้มีความแตกต่างที่ชัดเจนระหว่างการใช้ประโยชน์และการตัดสินใจในความคืบหน้า ตัวอย่างแรกของเราแสดงให้เห็น การตัดสินใจเกี่ยวกับการใช้ประโยชน์มุ่งเน้นไปที่ผู้มีอำนาจตัดสินใจที่ต้องเผชิญกับทางเลือกระหว่างทางเลือกที่น่าสนใจเท่าเทียมกันสองทาง เช่น ความชอบที่เปลี่ยนไปเป็นทางเลือกที่มีต้นทุนต่ำ ในทางตรงกันข้าม ตัวอย่างที่สองของเราเน้นชุดของการตัดสินใจที่ก้าวหน้า ซึ่งผู้มีอำนาจตัดสินใจจัดสรรทรัพยากรเพิ่มเติมให้กับทางเลือกที่เลือกในขั้นต้น ซึ่งจะทำให้ต้นทุนที่ลดลงเพิ่มโอกาสในการจัดสรรเงินทุนเพิ่มเติม

สอดคล้องกับข้อโต้แย้งนี้ เป็นเรื่องน่าแปลกใจที่วรรณกรรมทางวิชาการเกี่ยวกับผลกระทบ เว็บแทงบอลยูฟ่า ของต้นทุนจมไม่ได้แยกความแตกต่างอย่างชัดเจนระหว่างการตัดสินใจทั้งสองประเภทนี้ (เช่น Arkes และ Blumer 1985). จนถึงปัจจุบัน การขาดความแตกต่างรวมกับคำจำกัดความที่คลุมเครือของผลกระทบของต้นทุนจมไม่ได้ทำให้สามารถเปรียบเทียบหรือสรุปผลการค้นพบที่เกี่ยวข้องได้ ไม่มีการตรวจสอบที่ครอบคลุมที่อธิบายอย่างละเอียดเกี่ยวกับขนาดผลกระทบที่แตกต่างกัน หรือและที่สำคัญกว่านั้นคือ การทบทวนที่ตรวจสอบผู้ดูแลที่เป็นไปได้ของผลกระทบสำหรับการตัดสินใจทั้งสอง นอกจากนี้ การวิจัยทั้งสองประเภทมักจะอธิบายอย่างละเอียดเกี่ยวกับผลกระทบสุทธิที่อาจได้รับอิทธิพลจากปัจจัยอื่นๆ มากกว่าผลกระทบจากต้นทุนที่ทรุดโทรมเอง สิ่งนี้ทำให้การค้นพบนี้เปรียบเทียบกันน้อยลง ดังนั้นจึงไม่น่าแปลกใจที่จะสังเกตเห็นข้อขัดแย้งเกี่ยวกับการมีอยู่ ผู้กลั่นกรอง และสาเหตุพื้นฐานของผลกระทบของต้นทุนจม (Staw 1976 ; Thaler 1980 ; Arkes and Blumer 1985 ; Ashraf et al.2553 ).

งานวิจัยในปัจจุบันพยายามที่จะเติมช่องว่างนี้โดยนำเสนอผลการทบทวนการวิเคราะห์อภิมานเกี่ยวกับอิทธิพลของผู้กลั่นกรองที่เป็นไปได้ต่อผลกระทบของต้นทุนทางการเงินที่ลดลง แม้ว่าเราคาดว่าอิทธิพลของต้นทุนที่จมจะแตกต่างกันไประหว่างการใช้ประโยชน์และการตัดสินใจในความคืบหน้า เรายังโต้แย้งว่าผู้กลั่นกรองผลกระทบที่มีต่อผลกระทบต่างกัน ดังนั้น วัตถุประสงค์หลักของบทความนี้คือการวิเคราะห์ปัจจัยที่มีอิทธิพลต่อผลกระทบของต้นทุนจมต่อการตัดสินใจทางเศรษฐกิจอย่างเป็นระบบ โดยคำนึงถึงการใช้ประโยชน์และการตัดสินใจที่ก้าวหน้า ดังนั้นเราจึงจัดการกับงานที่ท้าทายในการสรุปสิ่งที่ค้นพบสำหรับการตัดสินใจแต่ละประเภท ในขณะที่ยังคงรักษาภาพรวมในวงกว้างของผลกระทบของต้นทุนที่ลดลงต่อการตัดสินใจทางเศรษฐกิจ
1) สัญญาอัจฉริยะทั้งสี่ที่มีตัวเลือก–optimize ที่ปิดไปก่อนหน้านี้ ได้เห็นการเปลี่ยนแปลงของต้นทุนก๊าซของฟังก์ชันสาธารณะแต่ละรายการ ยกตัวอย่างเช่น0xd0a6 ~ 7ccfประสบการณ์การเพิ่มขึ้นของค่าใช้จ่ายในช่วงครึ่งปีของการทำงานของประชาชนในขณะที่มันเห็นลดค่าใช้จ่ายในสองฟังก์ชั่นการทำสัญญา ในทางกลับกันสัญญา0xB680 ∼ 8385จะมีฟังก์ชันครึ่งหนึ่งที่ช่วยลดต้นทุนค่าน้ำมัน และมีข้อยกเว้นประการหนึ่งสำหรับการเพิ่มต้นทุน นี่แนะนำว่าอย่างน้อยเครื่องมือเพิ่มประสิทธิภาพโค้ดสามารถปรับเปลี่ยนต้นทุนก๊าซสำหรับฟังก์ชันต่างๆ ได้ และอาจนำไปสู่การประนีประนอมระหว่างการเพิ่มต้นทุนให้กับบางฟังก์ชันและในขณะเดียวกันก็ลดไปยังบางฟังก์ชันด้วย

2) แม้ว่าโปรแกรมเพิ่มประสิทธิภาพโค้ดจะมีผลบางอย่างในการเปลี่ยนค่าน้ำมันของฟังก์ชัน แต่ดูเหมือนว่าจะมีผลเพียงเล็กน้อยในการป้องกันข้อยกเว้นของแก๊สจริงๆ อีกครั้ง ดูสัญญาที่ขีดเส้นใต้ทั้งสี่ฉบับ สัญญาเหล่านี้ได้เห็นการลดต้นทุนก๊าซบางส่วน (อย่างน้อยก็สำหรับบางฟังก์ชัน) แต่กลับกลายเป็นว่าไม่มีธุรกรรมข้อยกเว้นเดียวที่สามารถแก้ไขได้เพียงเพราะการลดต้นทุนก๊าซ สาเหตุอาจเป็นเพราะธุรกรรมก่อนหน้านี้ได้กำหนดขีดจำกัดของก๊าซที่ต่ำเกินไปซึ่งการปรับให้เหมาะสมที่สุดไม่สามารถจัดการเพื่อประหยัดได้ หรือฟังก์ชันที่มีการลดต้นทุนอย่างมากนั้นไม่ใช่ฮอตสปอตสำหรับข้อยกเว้นก๊าซธรรมชาติ

3) เมื่อดูที่ส่วนInstanceเราพบว่ามีเพียงสัญญาเดียว ( 0x06012 ∼ 266d ) ที่ดูเหมือนจะอ่อนไหวต่อการใช้เทคนิคการเพิ่มประสิทธิภาพโค้ด อันที่จริง ไม่มีหน้าที่ใดในสัญญานี้ที่ได้เห็นการเปลี่ยนแปลงของต้นทุนก๊าซ และลักษณะของธุรกรรมเหล่านี้เป็นเพียงผลพลอยได้จากการประเมินค่าต่ำเกินไปของตัวประมาณค่าก๊าซsolc ในตารางที่ 8เราคำนวณSolve of Instanceโดยเปรียบเทียบการประมาณค่าก๊าซsolcกับขีดจำกัดของก๊าซจริง เนื่องจากตัวประมาณค่าอาจส่งคืนค่าที่อ่านได้ต่ำเกินไปในบางกรณี ธุรกรรมเหล่านี้จึงแสดงเป็นผลบวกที่ผิดพลาด

แนวทางอื่นๆ
นอกจากการประมาณค่าก๊าซสำหรับการทำธุรกรรมก่อนส่งแล้ว ยังมีวิธีการอื่นๆ เพื่อช่วยผู้ใช้ในการป้องกันข้อยกเว้นของก๊าซ แนวทางหนึ่งที่มีแนวโน้มดีคือการสร้าง bytecode ที่ปรับให้เหมาะสมกับแก๊สมากขึ้น เพื่อให้สัญญาสามารถใช้แก๊สน้อยลงระหว่างการดำเนินการ ตัวอย่างเช่นsolcให้ตัวเลือกในการเพิ่มประสิทธิภาพโค้ด เช่นตัวเลือก–optimize ที่มาพร้อมกับพารามิเตอร์การปรับให้เหมาะสมเชิงประจักษ์ที่แก้ไขได้ เช่น–optimize-runsซึ่งระบุจำนวนการเรียกใช้ที่คาดไว้สำหรับแต่ละฟังก์ชันสัญญา มีการเสนอเครื่องมือที่มีประโยชน์อื่น ๆ เพื่อตรวจจับและแก้ไขส่วนย่อยของรหัสที่ปรับให้เหมาะสมต่ำกว่า [ 23 ] หรือเพื่อสร้างรหัสที่เน้นการใช้แก๊สเป็นศูนย์กลางจาก bytecode ที่มีอยู่ [ 25]. สุดท้ายแต่ไม่ท้ายสุด แนวทางอื่นในการป้องกันข้อยกเว้นก๊าซคือการค้นหาสัญญาที่มีรหัสไม่ถูกต้องก่อนการติดตั้งใช้งาน เพื่อที่ว่าสัญญาที่ใช้งานจะไม่มีช่องโหว่ใดๆ ที่อาจก่อให้เกิดข้อยกเว้นก๊าซ [ 21 ] เราเสนอให้ตรวจสอบเครื่องมือเหล่านี้ในการศึกษาเพิ่มเติม

สรุปและความหมาย
บนพื้นฐานของผลก่อนและการอภิปรายเราสรุปผลการวิจัยที่สำคัญเช่นเดียวกับผลกระทบต่อไปในตารางที่ 9 นอกจากนี้ เรายังชี้ให้เห็นฝ่ายที่เกี่ยวข้องหรือผู้มีส่วนได้ส่วนเสียที่อาจสนใจในการค้นหาและความหมายแต่ละอย่าง เช่น นักพัฒนา BCP ผู้ใช้ปลายทาง BCP ผู้ผลิตเครื่องมือพัฒนา นักวิจัยบล็อคเชน เป็นต้น

ตารางที่ 9 สรุปข้อค้นพบและความหมายที่สำคัญ
ตารางขนาดเต็ม
งานที่เกี่ยวข้อง
แอปพลิเคชั่นกระจายอำนาจ
แอปพลิเคชันแบบกระจายอำนาจ (dApp) และแอปพลิเคชันระบบคลาวด์ที่ใช้บล็อกเชน (BCP) สามารถมองได้คร่าวๆ ว่าเป็นแอปพลิเคชันประเภทเดียวกัน โดยที่บล็อกเชนและสัญญาอัจฉริยะใช้ส่วนหนึ่งของตรรกะของโปรแกรมที่สำคัญ

การศึกษาแอปพลิเคชันกระจายอำนาจ (dApp) หรือแอปพลิเคชันคลาวด์บนบล็อกเชนเพิ่งได้รับความนิยมในแวดวงวิชาการ [ 5 , 10 , 35 – 43 ] มีแนวโน้มเพิ่มขึ้นพร้อมกับความสนใจสาธารณะที่เพิ่มขึ้น ออกมาอย่างต่อเนื่อง โดยที่ dApps ยอดนิยมอย่าง CryptoKitties, Ethereum Name Service, My Crypto Heros, MakerDAO และอื่นๆ

วูและคณะ [ 35 , 43 ] ได้ทำการศึกษาเชิงประจักษ์เกี่ยวกับแอปพลิเคชั่นกระจายอำนาจบนบล็อคเชน (เช่น dApp) ใน Ethereum ด้วย 995 dApps ใน 17 หมวดหมู่ที่แตกต่างกัน จากการศึกษาของพวกเขา Ethereum dApps ที่มีนัยทางการเงิน (เช่น การแลกเปลี่ยน การเงิน และการพนัน) ได้รับความนิยมมากกว่าคนอื่นๆ ปรากฏการณ์เดียวกันนี้เกิดขึ้นซ้ำแล้วซ้ำอีกเมื่อพิจารณาจากทั้งบัญชีผู้ใช้และการสื่อสารธุรกรรม ผู้เขียนยังได้ตรวจสอบระดับของโอเพ่นซอร์สสำหรับ Ethereum dApps ผลลัพธ์แสดงว่า dApps เพียงเล็กน้อย (15.7 % ) เท่านั้นที่เป็นโอเพ่นซอร์สทั้งในแง่ของรหัสโครงการและสัญญาอัจฉริยะ ในขณะที่น้อยกว่าครึ่งหนึ่งเล็กน้อย (43.5 % )) มีสัญญาอัจฉริยะทั้งหมดแบบโอเพนซอร์ส แม้แต่การพิจารณาสัญญาอัจฉริยะ เราก็สังเกตเห็นว่า dApps มากกว่าครึ่งไม่ได้จัดเตรียมซอร์สโค้ดทั้งหมด ในขณะที่บางตัวอาจเผยแพร่บางส่วนของโค้ด ข้อเท็จจริงชี้ให้เห็นว่ายังมีพื้นที่มากมายสำหรับการเคลื่อนไหวของโอเพ่นซอร์สในระบบนิเวศของ dApp เพื่อเข้าถึงอนาคตที่สดใสของแอพพลิเคชั่นกระจายอำนาจบนบล็อคเชน สุดท้าย งานเดียวกันนี้ยังสรุปรูปแบบการออกแบบทั่วไปสำหรับสัญญาอัจฉริยะของ dApp และปัญหาที่เกี่ยวข้องกับต้นทุนก๊าซที่เกี่ยวข้องกับ dApps

มีงานบางอย่างที่พิจารณาถึงวิธีการพัฒนาของ dApps Marchesi และคณะ [ 40 ] เสนอวิธีการพัฒนาซอฟต์แวร์ที่คล่องตัวสำหรับ dApps ซึ่งเป็นกระบวนการรวบรวมความต้องการ วิเคราะห์ ออกแบบ พัฒนา ทดสอบ และปรับใช้แอปพลิเคชันเหล่านี้ ผู้เขียนได้นำเสนอขั้นตอนโดยละเอียด ข้อควรพิจารณาในการออกแบบ และการแก้ไขเครื่องมือพร้อมบทแนะนำที่เหมาะสม Elul และคณะ [ 37 ] นำเสนอรูปแบบการเขียนโปรแกรมแบบรวมสำหรับการพัฒนา dApp อนุญาตให้นักพัฒนาสร้างระบบดังกล่าวผ่านสิ่งประดิษฐ์รหัสเดียว

งานอื่น ๆ อุทิศแอปพลิเคชันของ dApp ในกรณีการใช้งานต่างๆ Taş et al. [ 42 ] ใช้ตัวอย่าง dApp เพื่ออธิบายข้อควรพิจารณาด้านสถาปัตยกรรมและเครื่องมือที่มีประโยชน์สำหรับการพัฒนา dApp เทียนและคณะ [ 10 ] เสนอกรอบการกระจายอำนาจที่ปลอดภัยสำหรับการค้นพบความจริงในเอกสารของ crowdsourcing ด้วยการรักษาความเป็นส่วนตัวและการใช้งานที่เชื่อถือได้ จอห์นสันและคณะ [ 38 ] แสดงให้เห็นโซลูชัน dApp ใหม่สำหรับการแบ่งปันข้อมูลชีวการแพทย์ที่ปลอดภัยโดยอิงตาม Oasis Devnet ซึ่งเป็นบล็อกเชนที่รักษาความเป็นส่วนตัวซึ่งเข้ากันได้กับ EVM ผู้เขียนยังเปรียบเทียบโซลูชันแบบเดิมกับโซลูชัน dApp โดยแสดงทั้งข้อดีและข้อเสียของ dApp ของตน เฉินและคณะ [ 36] นำเสนอลอตเตอรี dApp ที่มีแหล่งสุ่มหลายแหล่ง (เช่น สถานะสัญญา สถานะบล็อกเชน และข้อผูกมัดนอกสายโซ่) ซึ่งมีความปลอดภัยมากกว่า (ในแง่ของการคาดการณ์ค่าสุ่ม) มากกว่า dApps ที่คล้ายคลึงกันที่มีอยู่ ลี และคณะ [ 39 ] แสดง dApp การเลือกปฏิบัติ Android APK ปลอมแปลงบนบล็อกเชน Hyperledger Fabric โดยใช้ประโยชน์จากคุณสมบัติป้องกันการงัดแงะของ blockchain Chen et al [ 5 ].

กลไกของก๊าซ Ethereum และข้อยกเว้นของก๊าซ
กลไกของก๊าซเป็นคุณสมบัติที่สำคัญของ Ethereum ซึ่งได้รับการออกแบบเพื่อแก้ปัญหาความคงอยู่ทั่วไปของระบบบล็อคเชนที่เปิดใช้งานสัญญาอัจฉริยะ ด้วยการจำกัดหน่วยก๊าซที่มีอยู่สูงสุดของธุรกรรมแต่ละรายการ กลไกก๊าซนี้สามารถป้องกัน Ethereum ไม่ให้ติดอยู่โดยการทำธุรกรรมที่ช้าหรือไม่มีที่สิ้นสุด (ไม่ว่าจะเป็นอันตรายหรือเป็นอันตราย) อย่างไรก็ตาม ในอีกด้านหนึ่งของเหรียญ เมื่อมีการจัดหาหน่วยก๊าซไม่เพียงพอ ธุรกรรมจะเป็นโทษของข้อยกเว้นรันไทม์ชนิดหนึ่ง กล่าวคือ ข้อยกเว้นก๊าซหมด

มีการศึกษาที่เกี่ยวข้องจำนวนมากเกี่ยวกับกลไกของ Ethereum gas และข้อยกเว้นของ gas ตั้งแต่การปรับโค้ดให้เหมาะสม การระบุช่องโหว่ การประมาณค่าก๊าซ และการปรับต้นทุน

วูและคณะ [ 35 ] ตรวจสอบต้นทุนก๊าซจริงwrtdApps ที่แตกต่างกัน โดยเฉพาะอย่างยิ่ง พวกเขาพบว่า dApps ที่ใช้สถาปัตยกรรมสัญญาเดียวมีแนวโน้มที่จะใช้ก๊าซโดยเฉลี่ยน้อยกว่า เมื่อเทียบกับรูปแบบผู้นำ ที่เทียบเท่า และรูปแบบโรงงาน นอกจากนี้ ในส่วนของค่าแก๊สในการนำไปใช้งาน พวกเขาพบว่าจำนวนฟังก์ชัน (NoF) และบรรทัดของโค้ด (LoC) ทั้งคู่มีส่วนทำให้ต้นทุนแก๊สในการนำไปใช้งานที่มากขึ้น ในขณะที่จำนวนฟังก์ชันมีความเกี่ยวข้องมากกว่าบรรทัดของโค้ด สำหรับค่าใช้จ่ายในการดำเนินการก๊าซ พวกเขารายงานว่าครึ่งหนึ่งของธุรกรรมสำหรับ dApps มีแนวโน้มที่จะให้วงเงินก๊าซในการดำเนินการเพิ่มเติมน้อยกว่า 100,000 รายการ (กล่าวคือ ธุรกรรมเหล่านี้สิ้นสุดด้วย 100,000 หน่วยก๊าซหรือน้อยกว่าที่มีอยู่) และด้วยการตั้งค่าขีดจำกัดก๊าซสำหรับการทำธุรกรรมเป็น 141,213 หน่วย ผู้ใช้จึงมั่นใจ 80% ว่าการทำธุรกรรมของพวกเขาจะสิ้นสุดลงโดยไม่มีข้อยกเว้นด้านก๊าซ เมื่อเทียบกับ et al. [ 35] งานของเราแตกต่างกันตรงที่เรามีชุดข้อมูลขนาดใหญ่กว่ามาก กล่าวคือ ธุรกรรมการยกเว้นก๊าซทั้งหมดตั้งแต่บล็อกการกำเนิดจนถึงเมื่อเร็ว ๆ นี้ ในขณะที่งานของพวกเขาพิจารณาเฉพาะส่วนเวลาหนึ่งปี (เช่น ปี 2018) และสัญญา จำกัดไว้เฉพาะผู้ที่เลือก 995 dApps ยิ่งไปกว่านั้น งานของเรามุ่งเน้นไปที่การตรวจสอบอย่างครอบคลุมเกี่ยวกับการยกเว้นก๊าซและปัญหาที่เกี่ยวข้อง (เช่น เปรียบเทียบกับข้อยกเว้นรันไทม์อื่น ๆ ระบุปัจจัยที่เป็นสาเหตุ และทดสอบเครื่องมือที่เกี่ยวข้องเพื่อป้องกันข้อยกเว้นของก๊าซ) ในขณะที่ [ 35 ] เพิ่มเติมเกี่ยวกับการค้นหา ขีด จำกัด ก๊าซที่เหมาะสมในแง่ของการทำธุรกรรม dApp

เฉินและคณะ [ 23 ] ศึกษาการใช้ภาษา Solidity ในการเขียนสัญญาอัจฉริยะ พวกเขาระบุรูปแบบระดับซอร์สโค้ดราคาแพงเจ็ดรูปแบบซึ่งคอมไพเลอร์Solidityอย่างเป็นทางการ ( solc ) ล้มเหลวในการปรับให้เหมาะสม รูปแบบเหล่านี้แบ่งออกเป็นสองกลุ่มเพิ่มเติม: รูปแบบที่เกี่ยวข้องกับโค้ดที่ไร้ประโยชน์และรูปแบบที่เกี่ยวข้องกับลูป จากนั้นพวกเขาจึงสร้างเครื่องมือที่เรียกว่าGASPERซึ่งสามารถค้นหารูปแบบสามในเจ็ดรูปแบบนี้โดยใช้สัญญาไบต์โค้ด ใน [ 25 ] ผู้เขียนคนเดียวกันได้รายงานรูปแบบการต่อต้านระดับ 24 bytecode และจากนั้นได้สร้างเครื่องมือเพิ่มประสิทธิภาพสัญญาชื่อGasReducerลงบนรูปแบบการต่อต้านเหล่านี้ ไม่เหมือนกับ [ 23 ] และ [ 25] งานของเรามุ่งเน้นไปที่การยกเว้นก๊าซ และเราใช้วิธีการที่มุ่งเน้นการวิเคราะห์เชิงประจักษ์เพื่อค้นหาผลที่ตามมา เหตุผล ตลอดจนความท้าทายต่อเครื่องมือหรือวิธีการที่มีอยู่ แม้ว่ารูปแบบการใช้แก๊สราคาแพงหรือการต่อต้านรูปแบบอาจนำไปสู่การยกเว้นก๊าซ แต่ก็ไม่ได้ชี้ขาดและไม่ครบถ้วน การวิเคราะห์บิ๊กดาต้า เช่น การให้คะแนนเครดิตและการวิเคราะห์เชิงคาดการณ์มีโอกาสมากมาย แต่ยังทำให้เกิดข้อกังวลอย่างมาก ซึ่งความเสี่ยงที่เร่งด่วนที่สุดคือความเสี่ยงของการเลือกปฏิบัติ แม้ว่าปัญหานี้จะได้รับการตรวจสอบมาก่อนแล้ว แต่ก็ยังขาดการศึกษาที่ครอบคลุมในหัวข้อนี้ การทบทวนวรรณกรรมนี้มีจุดมุ่งหมายเพื่อระบุการศึกษาบิ๊กดาต้าที่เกี่ยวข้องกับการเลือกปฏิบัติ เพื่อ (1) เข้าใจสาเหตุและผลที่ตามมาของการเลือกปฏิบัติในการทำเหมืองข้อมูล (2) ระบุอุปสรรคในการทำเหมืองข้อมูลอย่างยุติธรรม และ (3) สำรวจแนวทางแก้ไขที่เป็นไปได้สำหรับเรื่องนี้ ปัญหา.

วิธีการ
มีการค้นหาฐานข้อมูลหกฐานข้อมูลอย่างเป็นระบบ (ระหว่างปี 2010 ถึง 2017): PsychINDEX, SocIndex, PhilPapers, Cinhal, Pubmed และ Web of Science

ผลลัพธ์
บทความส่วนใหญ่กล่าวถึงความเสี่ยงที่อาจเกิดขึ้นจากการเลือกปฏิบัติของเทคโนโลยีการทำเหมืองข้อมูลในแง่มุมต่างๆ ในชีวิตประจำวัน (เช่น การจ้างงาน การตลาด การให้คะแนนเครดิต) เอกสารส่วนใหญ่เน้นที่กรณีของการเลือกปฏิบัติที่เกี่ยวข้องกับหมวดหมู่ที่เปราะบางในอดีต ในขณะที่รายงานอื่นๆ แสดงความกังวลว่าระบบการให้คะแนนและการวิเคราะห์เชิงคาดการณ์อาจแนะนำรูปแบบใหม่ของการเลือกปฏิบัติในภาคส่วนต่างๆ เช่น การประกันภัยและการดูแลสุขภาพ ผลที่ตามมาของการเลือกปฏิบัติของการทำเหมืองข้อมูลมีสาเหตุหลักมาจากความลำเอียงของมนุษย์และข้อบกพร่องของกฎหมาย ดังนั้นแนวทางแก้ไขที่แนะนำจึงรวมถึงกลยุทธ์การตรวจสอบที่ครอบคลุม การบังคับใช้กฎหมายคุ้มครองข้อมูล และกลยุทธ์เพิ่มความโปร่งใส สิ่งพิมพ์บางฉบับยังเน้นย้ำถึงการประยุกต์ใช้เทคโนโลยีบิ๊กดาต้าในเชิงบวก

บทสรุป
การทบทวนอย่างเป็นระบบนี้เน้นย้ำถึงความจำเป็นในการวิจัยเชิงประจักษ์เพิ่มเติมเพื่อประเมินว่าการเลือกปฏิบัติเกิดขึ้นโดยสมัครใจและเกิดขึ้นโดยไม่ได้ตั้งใจจากการใช้การวิเคราะห์ข้อมูลที่เพิ่มขึ้นในชีวิตประจำวันของเราอย่างไร นอกจากนี้ เนื่องจากเอกสารส่วนใหญ่มุ่งเน้นไปที่ผลการเลือกปฏิบัติเชิงลบของ Big Data จึงจำเป็นต้องมีการวิจัยเพิ่มเติมเกี่ยวกับการใช้ Big Data ในเชิงบวกที่อาจเกิดขึ้นโดยคำนึงถึงความไม่เท่าเทียมกันทางสังคม

บทนำ
บิ๊กดาต้าได้รับการอธิบายว่าเป็นคำตอบ “หนึ่งขนาดเหมาะกับทุกคน (ตราบใดที่เป็น XL สามตัว)” [ 24 ] เพื่อแก้ปัญหาที่ท้าทายที่สุดในด้านการเปลี่ยนแปลงสภาพภูมิอากาศ การดูแลสุขภาพ การศึกษา และอาชญวิทยา นี่อาจอธิบายได้ว่าทำไมมันถึงกลายเป็นคำศัพท์ประจำทศวรรษ บิ๊กดาต้าเป็นปรากฏการณ์ที่ซับซ้อนและกว้างขวางมาก ซึ่งมีความหมายที่ผันผวนตั้งแต่ปรากฏตัวในต้นปี 2010 [ 86 ] ตามเนื้อผ้ามันถูกกำหนดในแง่ของสี่มิติ (สี่ V ของบิ๊กดาต้า): ปริมาณ, ความเร็ว, ความหลากหลาย, และความจริง—แม้ว่านักวิชาการบางคนยังรวมถึงลักษณะอื่นๆ เช่นความซับซ้อน [ 63 ] และคุณค่า [ 5]—และประกอบด้วยการรวบรวม จัดเก็บ วิเคราะห์ แบ่งปัน และเชื่อมโยงข้อมูลจำนวนมหาศาลที่สร้างขึ้นผ่านเทคโนโลยีและเครือข่ายที่ใช้คอมพิวเตอร์เป็นหลัก เช่น สมาร์ทโฟน คอมพิวเตอร์ กล้อง เซ็นเซอร์ ฯลฯ [ 40 ] ในขณะที่เราอาศัยอยู่ในโลกที่มีเครือข่ายมากขึ้น ซึ่งรูปแบบใหม่ของแหล่งข้อมูลและการสร้างข้อมูล (เช่น การแชร์วิดีโอ การส่งข้อความออนไลน์ การซื้อทางออนไลน์ โซเชียลมีเดีย สมาร์ทโฟน) ปริมาณและความหลากหลายของข้อมูลที่รวบรวมจากบุคคลได้เพิ่มขึ้น ตั้งแต่ข้อมูลตัวเลขที่มีโครงสร้างไปจนถึงเอกสารข้อความที่ไม่มีโครงสร้าง เช่น อีเมล วิดีโอ เสียง และธุรกรรมทางการเงิน (SAS-Institute) [ 72 ]

ที่น่าสนใจ เนื่องจากระบบคำนวณแบบเดิมไม่สามารถประมวลผลและทำงานกับ Big Data ได้ นักวิชาการได้อธิบายลักษณะของปรากฏการณ์นี้โดยสัมพันธ์กับความท้าทายทางเทคนิคที่เกิดขึ้นอย่างเคร่งครัด เช่น ปริมาณและความเร็ว เช่น นำเสนอทันที ความท้าทายต่อโครงสร้างไอทีแบบดั้งเดิม เนื่องจากบริษัทไม่มีโครงสร้างพื้นฐานที่จำเป็นในการรวบรวม จัดเก็บ และประมวลผลข้อมูลจำนวนมหาศาลที่สร้างขึ้นด้วยความเร็วที่สูงขึ้น ความหลากหลายหมายถึงความแตกต่างของข้อมูลทั้งที่มีโครงสร้างและไม่มีโครงสร้างที่รวบรวมจากแหล่งที่แตกต่างกันมาก ทำให้การจัดเก็บและการประมวลผลซับซ้อนยิ่งขึ้น และสุดท้าย เนื่องจากเทคโนโลยีบิ๊กดาต้ากำลังจัดการกับข้อมูลที่มีปริมาณมาก ความเร็ว และข้อมูลที่มีคุณภาพต่างกันอย่างมาก5 ].

แม้จะมีปัญหาที่กล่าวมาแล้ว เราก็ไม่ควรลืมว่าการวิเคราะห์บิ๊กดาต้า—เข้าใจว่าเป็นเทคนิคดิจิทัลขั้นสูงมากมายเหลือเฟือ (เช่น การทำเหมืองข้อมูล, โครงข่ายประสาทเทียม, การเรียนรู้เชิงลึก, การทำโปรไฟล์, การตัดสินใจอัตโนมัติและระบบการให้คะแนน) ที่ออกแบบมาเพื่อวิเคราะห์ชุดข้อมูลขนาดใหญ่ด้วย จุดมุ่งหมายของการเปิดเผยรูปแบบ แนวโน้ม และความสัมพันธ์ที่เกี่ยวข้องกับพฤติกรรมมนุษย์—มีบทบาทสำคัญมากขึ้นในชีวิตประจำวันของเรา: การตัดสินใจยอมรับหรือปฏิเสธเงินกู้ การให้หรือปฏิเสธการทัณฑ์บน หรือการยอมรับหรือปฏิเสธการสมัครงานได้รับอิทธิพลจาก เครื่องจักรและอัลกอริธึมมากกว่าโดยบุคคล เทคโนโลยีการวิเคราะห์ข้อมูลจึงมีความเกี่ยวข้องมากขึ้นเรื่อยๆ กับลักษณะส่วนบุคคลที่ละเอียดอ่อนของผู้คน การกระทำประจำวันของพวกเขา และโอกาสในอนาคตของพวกเขา ดังนั้นจึงไม่น่าแปลกใจเลยที่นักวิชาการจำนวนมากเริ่มกลั่นกรองเทคโนโลยีบิ๊กดาต้าและการประยุกต์ใช้เพื่อวิเคราะห์และทำความเข้าใจประเด็นทางจริยธรรมและสังคมของบิ๊กดาต้า ข้อกังวลที่พบบ่อยที่สุดเกี่ยวกับความเป็นส่วนตัวและการไม่เปิดเผยตัวตนของข้อมูล [26 , 29 ], ความยินยอมโดยแจ้ง [ 41 ], ความท้าทายทางญาณวิทยา [ 28 ] และข้อกังวลด้านแนวคิดอื่นๆ เช่น การกลายพันธุ์ของแนวคิดเกี่ยวกับอัตลักษณ์ส่วนบุคคลเนื่องจากการจัดทำโปรไฟล์ [ 27 ] หรือการวิเคราะห์การเฝ้าระวังใน “การสร้างข้อมูล” หรือ ” data-fied” สังคม [ 7 ]

หนึ่งในประเด็นที่น่ากังวลที่สุดแต่ยังอยู่ภายใต้การวิจัยของเทคโนโลยีบิ๊กดาต้าคือความเสี่ยงของการเลือกปฏิบัติที่อาจเกิดขึ้น แม้ว่า “ไม่มีคำจำกัดความการเลือกปฏิบัติที่เป็นที่ยอมรับในระดับสากล” [ 82 ] คำนี้โดยทั่วไปหมายถึงการกระทำ แนวปฏิบัติ หรือนโยบายที่สร้างความเสียเปรียบต่อบุคคลเนื่องจากการเป็นสมาชิกของกลุ่มสังคมสำคัญหรือกลุ่มเปราะบางที่ได้รับการยอมรับตามเพศ เชื้อชาติ สีผิว ภาษา ศาสนา ความคิดเห็นทางการเมือง ชนกลุ่มน้อย ฯลฯ [ 61 ] สำหรับขอบเขตของการศึกษาของเรา เรายึดถือแนวคิดทั่วไปเกี่ยวกับการเลือกปฏิบัติดังกล่าว และแยกความแตกต่างระหว่างการเลือกปฏิบัติโดยตรงเท่านั้น(กล่าวคือ กระบวนการที่แบ่งแยกชนกลุ่มน้อยหรือกลุ่มที่เสียเปรียบบนพื้นฐานของลักษณะการเลือกปฏิบัติที่ละเอียดอ่อนที่เกี่ยวข้องกับการเป็นสมาชิกกลุ่ม เช่น เชื้อชาติ เพศ หรือรสนิยมทางเพศ) และการเลือกปฏิบัติทางอ้อม (เช่น กระบวนการที่อาจเลือกปฏิบัติต่อชนกลุ่มน้อยโดยเจตนาหรือโดยไม่ได้ตั้งใจ โดยไม่ได้กล่าวถึงอย่างชัดเจน คุณลักษณะการเลือกปฏิบัติ) [ 32 ]. นอกจากนี้เรายังรับทราบถึงความเชื่อมโยงอย่างใกล้ชิดระหว่างการเลือกปฏิบัติและความไม่เท่าเทียมกัน เนื่องจากผลเสียที่เกิดจากการเลือกปฏิบัติจำเป็นต้องนำไปสู่ความไม่เท่าเทียมกันระหว่างกลุ่มที่ได้รับการพิจารณา [ 75 ]

แม้ว่าการวิจัยเกี่ยวกับการเลือกปฏิบัติในเทคโนโลยีการทำเหมืองข้อมูลจะยังห่างไกลจากการวิจัยใหม่ [ 69 ] แต่ก็ได้รับแรงผลักดันเมื่อเร็วๆ นี้ โดยเฉพาะอย่างยิ่งหลังจากการตีพิมพ์รายงานของทำเนียบขาวปี 2014 ซึ่งเตือนอย่างหนักแน่นว่าการเลือกปฏิบัติอาจเป็นผลลัพธ์โดยไม่ได้ตั้งใจของเทคโนโลยี Big Data [ 65 ]. ตั้งแต่นั้นมา ผลลัพธ์การเลือกปฏิบัติที่เป็นไปได้ของระบบการทำโปรไฟล์และการให้คะแนนได้รับความสนใจจากสาธารณชนทั่วไปมากขึ้น ตัวอย่างเช่น ในสหรัฐอเมริกา เทคโนโลยีระบบที่ใช้ในการประเมินความเสี่ยงในอนาคตของการกระทำผิดซ้ำระหว่างจำเลยถูกพบว่าเลือกปฏิบัติกับคนผิวสี [ 23 ] ในทำนองเดียวกัน ในสหราชอาณาจักร พบว่าอัลกอริทึมที่ใช้ในการตัดสินใจควบคุมตัวถูกเลือกปฏิบัติต่อผู้มีรายได้น้อย [ 15]. แต่แอปพลิเคชันที่มีพลเมืองเป็นศูนย์กลาง เช่น แอป Street Bump ของบอสตัน ซึ่งพัฒนาขึ้นเพื่อตรวจหาหลุมบ่อบนถนนก็อาจเป็นการเลือกปฏิบัติเช่นกัน โดยอาศัยการใช้สมาร์ทโฟน แอพมีความเสี่ยงที่จะเพิ่มการแบ่งแยกทางสังคมระหว่างย่านที่มีพลเมืองสูงอายุหรือผู้มั่งคั่งน้อยกว่าจำนวนมาก และพื้นที่ร่ำรวยที่มีเจ้าของสมาร์ทโฟนรุ่นเยาว์มากขึ้น [ 67 ]

การแพร่หลายของกรณีเหล่านี้อธิบายได้ว่าทำไมการเลือกปฏิบัติในเทคโนโลยีบิ๊กดาต้าจึงกลายเป็นประเด็นร้อนในหลากหลายสาขาวิชา ตั้งแต่วิทยาการคอมพิวเตอร์ การตลาด ไปจนถึงปรัชญา ส่งผลให้คลังข้อมูลของสหสาขาวิชาชีพกระจัดกระจายและกระจัดกระจาย ทำให้ยากต่อการเข้าถึงแก่นแท้ทั้งหมด ของปัญหา การทบทวนวรรณกรรมของเราจึงมีจุดมุ่งหมายเพื่อระบุการศึกษาที่เกี่ยวข้องกับ Big Data ที่เกี่ยวข้องกับการเลือกปฏิบัติจากสาขาวิชาต่างๆ เพื่อ (1) เข้าใจสาเหตุและผลที่ตามมาของการเลือกปฏิบัติในการวิเคราะห์ข้อมูล (2) เพื่อระบุอุปสรรคในการทำเหมืองข้อมูลอย่างยุติธรรม และ (3) สำรวจแนวทางแก้ไขปัญหาที่แนะนำสำหรับปัญหานี้

วิธีการ
มีการทบทวนวรรณกรรมอย่างเป็นระบบโดยค้นหาฐานข้อมูล 6 ฐานข้อมูลต่อไปนี้: PsycINFO, SocINDEX, PhilPapers, Cinhal, Pubmed และ Web of Science (ดูตารางที่ 1 )

ตารางที่ 1 คำค้นหา
ตารางขนาดเต็ม
มีการใช้คำค้นหาต่อไปนี้: “ข้อมูลขนาดใหญ่” “ข้อมูลดิจิทัล” “การทำเหมืองข้อมูล” “การเชื่อมโยงข้อมูล” “การเลือกปฏิบัติ*” “*ความเท่าเทียมกัน” “ช่องโหว่*” “*ความยุติธรรม” “จริยธรรม* ” และ “การยกเว้น”” คำศัพท์ถูกรวมเข้าด้วยกันโดยใช้ตรรกะบูลีน (ดูตารางที่ 1). เกณฑ์การคัดเลือกคือ (1) เอกสารที่ตีพิมพ์ระหว่างปี 2010 ถึงธันวาคม 2017 และ (2) เขียนเป็นภาษาอังกฤษ หน้าต่างสิ่งพิมพ์ที่ค่อนข้างแคบได้รับเลือกเนื่องจาก “ข้อมูลขนาดใหญ่” กลายเป็นคำศัพท์ในวงการวิชาการในช่วงทศวรรษที่ผ่านมาเท่านั้น และเนื่องจากเราต้องการกำหนดเป้าหมายเฉพาะบทความที่เน้นที่เทคโนโลยีดิจิทัลล่าสุดสำหรับการทำโปรไฟล์และการวิเคราะห์เชิงคาดการณ์ เพื่อให้ได้ความเข้าใจที่กว้างขึ้นเกี่ยวกับการเลือกปฏิบัติและความไม่เท่าเทียมกันที่เกี่ยวข้องกับบิ๊กดาต้า ไม่มีการจำกัดระเบียบวินัยของเอกสาร (การแพทย์ จิตวิทยา สังคมวิทยา วิทยาการคอมพิวเตอร์ ฯลฯ) หรือประเภทของวิธีการ (เชิงปริมาณ เชิงคุณภาพ แบบผสมหรือตามทฤษฎี) หนังสือ (เอกสารและเล่มที่แก้ไข) การดำเนินการประชุม วิทยานิพนธ์ บทวิจารณ์วรรณกรรมและโปสเตอร์ถูกละเว้น

โปรโตคอลการค้นหาจาก Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) method [ 57 ] ได้รับการปฏิบัติตามและส่งผลให้มีเอกสาร 2312 ฉบับ (ดูรูปที่ 1). มีการเพิ่มเอกสารสองฉบับที่ระบุผ่านแหล่งอื่น ผลลัพธ์ถูกสแกนหารายการซ้ำ (609) และเหลือ 1705 ในขั้นตอนนี้ เราได้รวมบทความทั้งหมดที่กล่าวถึง อภิปราย แจกแจง หรืออธิบายการเลือกปฏิบัติ การแบ่งแยกทางดิจิทัลหรือความไม่เท่าเทียมกันทางสังคมที่เกี่ยวข้องกับ Big Data (ตั้งแต่การขุดข้อมูลและการวิเคราะห์เชิงคาดการณ์ไปจนถึงการทำโปรไฟล์) ดังนั้น เอกสารที่เน้นประเด็นเกี่ยวกับเอกราช ความเป็นส่วนตัว และความยินยอมเป็นหลัก จึงไม่รวมถึงเอกสารที่อธิบายเพียงวิธีการรับรู้หรือจำแนกบุคคลที่ใช้เทคโนโลยีดิจิทัลโดยไม่ยอมรับความเสี่ยงของการเลือกปฏิบัติ ความขัดแย้งระหว่างผู้เขียนคนแรกและคนที่สองได้รับการประเมินโดยผู้ตรวจทานคนที่สามซึ่งพิจารณาว่าบทความใดมีสิทธิ์ตามบทคัดย่อ โดยรวมแล้ว ไม่รวมระเบียน 1559 รายการ

มะเดื่อ 1
รูปที่ 1
ผังงาน PRISMA

ภาพขนาดเต็ม
ผู้เขียนคนแรกได้สแกนเอกสารอ้างอิงของบทความที่เหลืออีก 91 บทความเพื่อระบุการศึกษาที่เกี่ยวข้องเพิ่มเติม เพิ่ม 12 เอกสารผ่านกระบวนการนี้ ตัวอย่างสุดท้ายรวม 103 บทความ ในระยะต่อไป ผู้เขียนคนแรกได้อ่านข้อความฉบับเต็ม หลังจากการประเมินอย่างละเอียดถี่ถ้วนแล้ว 42 บทความได้รับการยกเว้นเนื่องจาก (1) บทความเหล่านี้ไม่ได้กล่าวถึงการเลือกปฏิบัติหรือความไม่เท่าเทียมกันที่เกี่ยวข้องกับเทคโนโลยีบิ๊กดาต้าหรือเพียงผิวเผินเท่านั้น และเน้นที่ความเสี่ยงที่เกี่ยวข้องกับความเป็นส่วนตัวหรือการยินยอมมากขึ้น (2) พวกเขาหารือเกี่ยวกับการเลือกปฏิบัติแต่ไม่เกี่ยวกับการพัฒนาเทคโนโลยีการวิเคราะห์บิ๊กดาต้า (3) พวกเขามุ่งเน้นไปที่การแบ่งแยกที่เพิ่มขึ้นระหว่างองค์กรที่มีอำนาจและทรัพยากรในการเข้าถึง วิเคราะห์ และทำความเข้าใจชุดข้อมูลขนาดใหญ่ (“กลุ่มข้อมูลขนาดใหญ่”) และองค์กรที่ไม่มีข้อมูล (“กลุ่มข้อมูลขนาดใหญ่”) [ 4] แทนที่จะอยู่บนแนวคิดของ Digital Divide ซึ่งหมายถึงช่องว่างระหว่างบุคคลที่เข้าถึงเทคโนโลยีบนอินเทอร์เน็ตได้ง่ายกับผู้ที่ไม่ได้ หรือ (4) พวกเขาประเมินความเหลื่อมล้ำที่ส่งผลต่อการมีส่วนร่วมในโซเชียลมีเดีย ระยะต่อมาของการทบทวนวรรณกรรมเกี่ยวข้องกับการวิเคราะห์บทความที่เหลืออีก 61 บทความ ข้อมูลต่อไปนี้ดึงมาจากเอกสาร: ปีที่พิมพ์, ประเทศ, ระเบียบวินัย, วิธีการ, ประเภทของการเลือกปฏิบัติ/ความไม่เท่าเทียมกันที่ส่งเสริมโดยเทคโนโลยีการทำเหมืองข้อมูล, แนวทางแก้ไขปัญหาการเลือกปฏิบัติ/ความไม่เท่าเทียมกัน, การประยุกต์ใช้ Big Data ที่เป็นประโยชน์เพื่อเปรียบเทียบการเลือกปฏิบัติ/ความไม่เท่าเทียมกัน, การอ้างอิงถึงการแบ่งแยกทางดิจิทัล การอ้างอิงถึงแนวคิดของ Black Box ในการทำให้เกิดการเลือกปฏิบัติ การประเมินองค์ประกอบของมนุษย์ในการทำเหมืองข้อมูล

ผลลัพธ์
จาก 61 เอกสารที่รวมอยู่ในการวิเคราะห์ของเรา 38 ฉบับเป็นเอกสารเชิงทฤษฎีที่กล่าวถึงความสัมพันธ์ระหว่างการเลือกปฏิบัติ ความไม่เท่าเทียมกันและเทคโนโลยี Big Data จากบทความที่เหลือ 23 บทความ ใช้วิธีเชิงปริมาณ 7 วิธี วิธีเชิงคุณภาพ 3 วิธี และวิทยาการคอมพิวเตอร์ 13 วิธีที่ใช้ทฤษฎีเพื่อต่อสู้หรือวิเคราะห์การเลือกปฏิบัติในการทำเหมืองข้อมูล จากนั้นจึงทดสอบทฤษฎีนี้ในชุดข้อมูลเชิงประจักษ์ เพื่อแยกความแตกต่างระหว่างแนวทางหลังจากวิธีการวิจัยเชิงประจักษ์แบบดั้งเดิม เราจัดการศึกษาดังกล่าวเป็นวิธีการ “อื่นๆ” (ทดลอง) เอกสารส่วนใหญ่ได้รับการตีพิมพ์หลังปี 2014 ( n  = 44) ปีที่ตีพิมพ์รายงานของทำเนียบขาวเกี่ยวกับคำมั่นสัญญาและความท้าทายของ Big Data [ 65]. เกือบหนึ่งในสามของการศึกษา (n = 22) มาจากสหรัฐอเมริกา 6 มาจากเนเธอร์แลนด์ 3 แห่งจากสหราชอาณาจักรและที่เหลือจากเบลเยียม สเปน เยอรมนี ฝรั่งเศส ออสเตรเลีย ไอร์แลนด์ อิตาลี แคนาดา หรืออิสราเอล เอกสารสิบฉบับมาจากมากกว่าหนึ่งประเทศ (ดูตาราง) เกี่ยวกับวินัยทางวิทยาศาสตร์ มีการตีพิมพ์บทความ 20 ฉบับในสาขาสังคมศาสตร์ 14 จากวิทยาการคอมพิวเตอร์ 14 จากกฎหมาย 14 จากชีวจริยธรรมและเพียง 2 จากปรัชญาและจริยธรรม ในด้านการสมัคร มีเอกสารจำนวนมาก (n = 24) กล่าวถึงการเลือกปฏิบัติที่เกี่ยวข้องกับการใช้ชีวิตประจำวันในแง่มุมต่างๆเช่น การจ้างงาน การโฆษณา ที่อยู่อาศัย ประกันภัย การให้คะแนนเครดิต ฯลฯ ในขณะที่บางเรื่องก็เน้นเฉพาะด้านใดด้านหนึ่ง .

การศึกษาส่วนใหญ่ (n = 38) ไม่ได้ให้คำจำกัดความของการเลือกปฏิบัติ แต่ถือว่าคำนี้อธิบายตนเองได้และมักเชื่อมโยงกับแนวคิดอื่นๆ เช่น ความไม่เท่าเทียมกัน ความอยุติธรรม และการกีดกัน การเลือกปฏิบัติที่กำหนดไว้สองสามอย่างเป็น “ผลกระทบที่แตกต่างกัน” “การปฏิบัติที่แตกต่างกัน” “การทำให้เป็นสีแดง” “การเลือกปฏิบัติทางสถิติ” ในขณะที่คนอื่น ๆ ให้คำจำกัดความ “ทางกฎหมาย” มากกว่าและอ้างถึงการปฏิบัติที่ไม่เท่าเทียมกันของ “ชนชั้นที่ได้รับการคุ้มครองตามกฎหมาย” หรือที่อ้างถึงโดยตรง กฎหมายระดับชาติหรือระหว่างประเทศที่มีอยู่ มีเพียงบทความเดียวเท่านั้นที่กล่าวถึงความแตกต่างระหว่างการเลือกปฏิบัติทางตรงและทางอ้อม (ดูตารางที่ 2 )

ตารางที่ 2 รายชื่อบทความที่รวมไว้
ตารางขนาดเต็ม
การเลือกปฏิบัติและการทำเหมืองข้อมูล
เพื่อที่จะสำรวจว่าการวิเคราะห์ข้อมูลขนาดใหญ่และ/หรือเทคนิคการทำเหมืองข้อมูลสามารถทำให้เกิดการเลือกปฏิบัติได้หรือไม่และอย่างไร เราจึงตัดสินใจแบ่งการศึกษาตาม (ก) ผลลัพธ์ที่เป็นไปได้ของการเลือกปฏิบัติของการวิเคราะห์ข้อมูล และ (ข) สาเหตุที่พบบ่อยที่สุดบางส่วน ของการเลือกปฏิบัติหรือความไม่เท่าเทียมกันในเทคโนโลยีบิ๊กดาต้า

รูปแบบ เป้าหมาย และผลของการเลือกปฏิบัติ
เอกสารจำนวนมากประเมินผลการเลือกปฏิบัติและไม่เป็นธรรมที่อาจเกิดขึ้นจากเทคโนโลยีข้อมูล (ดูตารางที่ 3 )

ตารางที่ 3 ผลการเลือกปฏิบัติของบิ๊กดาต้า
ตารางขนาดเต็ม
ในจำนวนนี้ มีเอกสารจำนวนมากที่เน้นให้เห็นถึงการเลือกปฏิบัติสองรูปแบบหลักที่นำมาใช้โดยการทำเหมืองข้อมูล ในบริบทนี้ ผู้เขียนบางคนเน้นถึงข้อเท็จจริงที่ว่ากลไกอัลกอริธึมดังกล่าวอาจส่งผลให้เกิดการเลือกปฏิบัติโดยไม่สมัครใจและโดยไม่ได้ตั้งใจ [ 8 , 14 , 17 , 21 , 25 , 39 , 45 , 54 , 73 , 93 ] ตัวอย่างเช่นBarocas และ Selbst [ 8 ] อ้างว่า “เมื่อพูดถึงการทำเหมืองข้อมูล การเลือกปฏิบัติโดยไม่ได้ตั้งใจเป็นปัญหาที่เร่งด่วนกว่าเพราะมักจะเป็นเรื่องธรรมดาและมองข้ามง่ายกว่า” [ 8] และแสดงความกังวลเกี่ยวกับความเป็นไปได้ที่ตัวแยกประเภทในการทำเหมืองข้อมูลอาจมีการเลือกปฏิบัติที่ผิดกฎหมายและเป็นอันตรายต่อชั้นเรียนที่ได้รับการคุ้มครองและหรือกลุ่มที่เปราะบาง Holtzhausen ในแนวเดียวกัน แย้งว่า “อัลกอริทึมอาจมีผลที่ไม่ได้ตั้งใจ” [ 39 ] และอาจทำให้เกิดอันตรายอย่างแท้จริงต่อบุคคล ตั้งแต่ความแตกต่างในด้านราคา การจ้างงาน การเฝ้าระวังของตำรวจ ผลการศึกษาอื่น ๆ บางส่วนเน้นย้ำว่าเทคโนโลยีการทำเหมืองข้อมูลอาจส่งผลให้เกิดการเลือกปฏิบัติโดยตรงและโดยสมัครใจ [ 32 , 39 , 46 ] ที่นี่เราปฏิบัติตามคำจำกัดความของการเลือกปฏิบัติโดยตรงที่เสนอโดย [ 32] ที่อธิบายว่าเป็นการเลือกปฏิบัติต่อชนกลุ่มน้อยหรือกลุ่มที่เสียเปรียบบนพื้นฐานของคุณลักษณะการเลือกปฏิบัติที่ละเอียดอ่อนที่เกี่ยวข้องกับการเป็นสมาชิกกลุ่ม เช่น เชื้อชาติ เพศ หรือรสนิยมทางเพศ ยกตัวอย่างเช่น Holtzhausen เตือนไม่ให้ใช้การเลือกปฏิบัติของการทำโปรไฟล์ชาติพันธุ์ในบ้านและการเฝ้าระวัง [ 1 , 39 ] กล่าวถึงผลลัพธ์ที่อาจกดขี่และเลือกปฏิบัติของการทำเหมืองข้อมูลในการอพยพและการทำโปรไฟล์ที่กำหนดการจำแนกและการจัดหมวดหมู่โดยอัตโนมัติและตามอำเภอใจสำหรับนักเดินทางที่มีความเสี่ยง

เอกสารบางฉบับยังระบุถึงเป้าหมายที่เป็นไปได้ของเทคโนโลยีการทำเหมืองข้อมูล [ 46 , 58 ] กล่าวถึงการแสวงหาประโยชน์จากช่องโหว่ที่เพิ่มขึ้นเป็นหนึ่งในผลที่ตามมาที่น่ากังวลที่สุดของการทำเหมืองข้อมูล พวกเขาอ้างว่าอัลกอริธึมอาจระบุผู้ที่มีความสามารถน้อยกว่า เช่น ผู้สูงอายุที่มีนิสัยติดการพนัน และหลอกล่อพวกเขาด้วยโฆษณาที่ตรงเป้าหมาย หรือโดยการชักชวนให้พวกเขา “นำเงินกู้ยืมที่มีความเสี่ยงออก หรือตัวเลือกสินเชื่อทันทีที่มีอัตราสูง ซึ่งใช้ประโยชน์จากช่องโหว่ของพวกเขา ” [ 58 ]. ลีเซ่ [ 48] อ้างว่าการเลือกปฏิบัติเป็นหนึ่งในอันตรายที่เกิดจากโปรไฟล์ขนาดใหญ่ของสังคมและความเสี่ยงนั้นสูงขึ้นสำหรับประชากรที่อ่อนแอ เอกสารที่ตรวจสอบแล้วสี่ฉบับยังสังเกตเห็นว่าเทคโนโลยีการทำโปรไฟล์และการทำเหมืองข้อมูลทำให้เกิดการเปลี่ยนแปลงที่เป็นอันตรายจากบุคคลที่ทำโปรไฟล์เดี่ยวและจัดประเภทเป็นกลุ่มใหญ่ เอกสารดังกล่าวแย้งว่าการตัดสินใจเกี่ยวกับการรวมข้อมูลที่รวบรวมอาจมีผลเสียต่อ (a) การรวมกลุ่มทั้งหมดของผู้ที่เกี่ยวข้องในชุดข้อมูล [ 53 ], (b) สำหรับผู้ที่ไม่ได้อยู่ในชุดข้อมูลที่วิเคราะห์ดั้งเดิม [ 30 ] และ (c) สำหรับบุคคลทั่วไปเนื่องจากการแทรกซึมของการทำเหมืองข้อมูลในกิจกรรมในแต่ละวันของเรา ขอบคุณบริษัทใหญ่ๆ เช่น Facebook, Twitter, Google [44 ]. de Vries [ 27 ] ได้นำแนวคิดนี้ไปอีกขั้นหนึ่งและแย้งว่าการใช้โปรไฟล์เครื่องจักรที่เพิ่มขึ้นและการจำแนกประเภทอัตโนมัติอาจนำไปสู่การเพิ่มการเลือกปฏิบัติในหลายภาคส่วนในระดับที่อาจทำให้การเลือกปฏิบัติถูกมองว่าเป็นการปฏิบัติที่ถูกต้องตามกฎหมายใน ประชาธิปไตยตามรัฐธรรมนูญ

เกี่ยวกับผลที่ตามมาของการใช้เทคโนโลยีบิ๊กดาต้า มีการกล่าวถึงการกีดกันทางสังคม การทำให้เป็นชายขอบและการตีตราใน 11 บทความ Lupton [ 51 ] แย้งว่าการเปิดเผยข้อมูลที่ละเอียดอ่อน โดยเฉพาะข้อมูลความชอบทางเพศและข้อมูลด้านสุขภาพที่เกี่ยวข้องกับภาวะเจริญพันธุ์และกิจกรรมทางเพศอาจส่งผลให้เกิดการตีตราและการเลือกปฏิบัติ ปลั๊ก [ 63 ] อธิบายว่าการลงทะเบียนสุขภาพสำหรับโรคติดต่อทางเพศสัมพันธ์มีความเสี่ยงที่จะแยกออกและยกเว้นชนกลุ่มน้อย Barocas และ Selbst [ 8 ] Pak et al. [ 59 ] และเทย์เลอร์ [ 78 ] แย้งว่าบุคคลบางคนจะถูกกีดกันและกีดกันจากการมีส่วนร่วมทางสังคมเนื่องจากการแบ่งแยกทางดิจิทัล

ตามวรรณกรรม เทคโนโลยีบิ๊กดาต้าอาจขยายเวลาความเหลื่อมล้ำและความเหลื่อมล้ำทางประวัติศาสตร์ทางสังคมและภูมิศาสตร์ที่มีอยู่ เช่น การเพิ่มการกีดกันชนกลุ่มน้อยทางชาติพันธุ์ออกจากการมีส่วนร่วมทางสังคม ทำให้สภาพความเป็นอยู่ของผู้ด้อยโอกาสทางเศรษฐกิจแย่ลง ขยายช่องว่างทางเศรษฐกิจระหว่างคนจนกับคนรวย ประเทศ ยกเว้นชนกลุ่มน้อยบางส่วนจากการดูแลสุขภาพ [ 13 , 14 , 60 , 79 , 80 , 85 ] และ/หรือแสดงภาพที่กระจัดกระจายและไม่สมบูรณ์ของประชากรผ่านเทคโนโลยีการทำเหมืองข้อมูล [ 13 ]

เอกสารบางฉบับยังเน้นว่าวิธีการใหม่ในการตัดสินใจอัตโนมัติและการปรับเปลี่ยนให้เป็นแบบส่วนตัวสามารถสร้างรูปแบบใหม่ของการเลือกปฏิบัติที่อยู่เหนือแนวคิดทางประวัติศาสตร์ของการเลือกปฏิบัติที่ผิดกฎหมาย และไม่เกี่ยวข้องกับชั้นเรียนที่ได้รับการคุ้มครองในอดีตหรือหมวดหมู่ที่เปราะบาง ตามที่ Newell และ Marabelli [ 58] บุคคลอาจถูกกีดกันโดยไม่ทราบสาเหตุและโดยไม่คาดคิดจากโอกาสบางอย่าง ถูกเอารัดเอาเปรียบโดยขาดความสามารถ และได้รับการปฏิบัติอย่างไม่เป็นธรรมผ่านการโฆษณาที่กำหนดเป้าหมายและการทำโปรไฟล์ วรรณกรรมที่ได้รับการทบทวนชี้ให้เห็นรูปแบบใหม่ของการเลือกปฏิบัติสองรูปแบบ: ประการแรก การเลือกปฏิบัติทางเศรษฐกิจหรือการตลาด กล่าวคือ การปฏิบัติต่อผู้บริโภคที่แตกต่างกันอย่างไม่เท่าเทียมกันโดยพิจารณาจากพฤติกรรมการซื้อหรือความไม่เท่าเทียมกันในการกำหนดราคาและข้อเสนอที่มอบให้กับลูกค้าตามโปรไฟล์ เช่น การประกันภัย หรือที่อยู่อาศัย [ 35 , 62 , 81 ]; ประการที่สอง การเลือกปฏิบัติตามการคาดการณ์ด้านสุขภาพ นั่นคือการปฏิบัติที่ไม่เท่าเทียมกันหรือการเลือกปฏิบัติของบุคคลโดยอิงจากข้อมูลด้านสุขภาพที่คาดการณ์ไว้ ไม่ใช่ตามจริง[ 2 , 22, 37 , 38 ].

สาเหตุของการเลือกปฏิบัติ
เอกสารหลายฉบับเน้นถึงองค์ประกอบหลักที่อาจทำให้เกิดการเลือกปฏิบัติหรือความไม่เท่าเทียมกันในเทคโนโลยี Big Data (ดูตารางที่ 4 )

ตารางที่ 4 สาเหตุของการเลือกปฏิบัติในการวิเคราะห์ข้อมูล
ตารางขนาดเต็ม
อัลกอริธึมสาเหตุของการเลือกปฏิบัติ
เอกสารสิบฉบับมุ่งเน้นไปที่วิธีการที่กลไกอัลกอริธึมและการจำแนกประเภทอาจทำให้การทำเหมืองข้อมูล การจำแนกประเภท และการทำโปรไฟล์เป็นการเลือกปฏิบัติ การศึกษาเหล่านี้เน้นย้ำว่าเทคโนโลยีการทำเหมืองข้อมูลมักเกี่ยวข้องกับรูปแบบการเลือกปฏิบัติทางสถิติ ผลลัพธ์ที่ไม่พึงประสงค์ต่อคลาสที่ได้รับการป้องกันอาจเกิดขึ้นโดยไม่สมัครใจเนื่องจากระบบการจำแนกประเภท Barocas และ Selbst [ 8 ] และ d’Alessandro et al. [ 25 ] ตัวอย่างเช่น ชี้ให้เห็นว่าในขณะที่กระบวนการค้นหาความสัมพันธ์ทางสถิติในชุดข้อมูลเป็นไปโดยอัตโนมัติ นักวิทยาศาสตร์คอมพิวเตอร์ยังคงต้องกำหนดทั้งตัวแปรเป้าหมายหรือผลลัพธ์ที่น่าสนใจ (“สิ่งที่ผู้ทำเหมืองข้อมูลกำลังมองหา”) และ “ป้ายกำกับคลาส” (“ที่แบ่งผลลัพธ์ที่เป็นไปได้ทั้งหมดของตัวแปรเป้าหมายในหมวดหมู่ไบนารีและหมวดหมู่ที่ไม่เกิดร่วมกัน”) [8 ]. ตราบใดที่นักวิทยาศาสตร์ข้อมูลจำเป็นต้องแปลปัญหาเป็นรหัสคอมพิวเตอร์ที่เป็นทางการ การตัดสินใจเลือกตัวแปรเป้าหมายและป้ายกำกับระดับเป็นกระบวนการเชิงอัตวิสัย อีกสาเหตุหนึ่งของอัลกอริทึมของการเลือกปฏิบัติเกี่ยวข้องกับข้อมูลที่มีอคติในแบบจำลอง ในการพัฒนาระบบอัตโนมัติ โมเดลการทำเหมืองข้อมูลจำเป็นต้องมีชุดข้อมูลในการฝึกอบรม เนื่องจากพวกเขาเรียนรู้ที่จะจำแนกประเภทตามตัวอย่างที่ให้มา เชอร์เมอร์ [ 73 ] แย้งว่าหากข้อมูลการฝึกอบรมปนเปื้อนด้วยการเลือกปฏิบัติหรือกรณีที่มีอคติ ระบบจะถือว่าพวกเขาเป็นตัวอย่างที่ถูกต้องในการเรียนรู้และทำซ้ำการเลือกปฏิบัติในผลลัพธ์ของตนเอง การปนเปื้อนนี้อาจมาจากชุดข้อมูลที่มีอคติในอดีต [ 14 ] หรือจากการกำหนดป้ายกำกับคลาสด้วยตนเองโดยผู้ขุดข้อมูล [ 8]. ปัญหาเพิ่มเติมเกี่ยวกับข้อมูลการฝึกอบรมอาจเป็นความเอนเอียงในการรวบรวมข้อมูล [ 8 ] หรืออคติตัวอย่าง [ 25 ] อคติในการเก็บรวบรวมข้อมูลที่สามารถนำเสนอตัวเองในฐานะที่เป็นUnderrepresentationในกลุ่มที่เฉพาะเจาะจงและ / หรือการเรียนการคุ้มครองในชุดข้อมูลซึ่งอาจส่งผลในการรักษาที่ไม่เป็นธรรมหรือไม่เท่ากันหรือยังมีoverrepresentationในชุดข้อมูลที่อาจส่งผลให้เกิด“ความสนใจสมส่วนไป กลุ่มชนชั้นที่ได้รับการคุ้มครองและการพิจารณาที่เพิ่มขึ้นอาจนำไปสู่ความน่าจะเป็นที่สูงขึ้นในการสังเกตการล่วงละเมิดเป้าหมาย” [ 25]. ภายในบริบทนี้ Kroll และเพื่อนร่วมงานได้กล่าวถึงปรากฏการณ์ของ “การใส่มากเกินไป” ซึ่ง “แบบจำลองอาจมีความเฉพาะทางมากเกินไปหรือเฉพาะเจาะจงกับข้อมูลที่ใช้ในการฝึกอบรม” และแทนที่จะค้นหากฎการตัดสินใจที่ดีที่สุดโดยรวม พวกเขาเพียงแค่เรียนรู้กฎที่เหมาะสมที่สุดเพื่อ ข้อมูลการฝึกอบรมจึงทำให้เกิดอคติ [ 45 ] สาเหตุที่เป็นไปได้อีกประการหนึ่งของอัลกอริทึมสำหรับผลลัพธ์การเลือกปฏิบัติคือ การมอบฉันทะสำหรับคุณลักษณะที่ได้รับการคุ้มครอง เช่น เชื้อชาติและเพศ ตัวแทนที่ได้รับการยอมรับในอดีตสำหรับการแข่งขัน เช่น รหัสไปรษณีย์ และ “การทับซ้อน” หมายถึงการเสียเปรียบอย่างเป็นระบบของย่านหรือชุมชนที่เฉพาะเจาะจงซึ่งมักเกี่ยวข้องกับเชื้อชาติ [ 73 ] ในบันทึกนี้ Zliobaite และ Custers [ 95] เน้นว่าในการขุดข้อมูล การกำจัดแอตทริบิวต์ที่ละเอียดอ่อนออกจากชุดข้อมูลไม่ได้ช่วยหลีกเลี่ยงผลลัพธ์ที่เลือกปฏิบัติ เนื่องจากอัลกอริทึมสามารถระบุพร็อกซีที่คาดเดาไม่ได้โดยอัตโนมัติสำหรับแอตทริบิวต์ที่ได้รับการป้องกัน เอกสารสองฉบับกล่าวถึงลูปป้อนกลับและการวนซ้ำอย่างเป็นระบบว่าเป็นสาเหตุที่เป็นไปได้ของการคาดคะเนที่ไม่เป็นธรรม [ 14 , 25]. สิ่งเหล่านี้เกี่ยวข้องกับการสร้างวงจรอุบาทว์เชิงลบที่อินพุตบางอย่างในชุดข้อมูลทำให้เกิดการเบี่ยงเบนทางสถิติที่เรียนรู้และต่อเนื่องโดยอัลกอริธึมในวงจรของสาเหตุและผลที่ตามมาด้วยตนเอง ตัวอย่างอาจช่วยชี้แจงกลไกนี้: การแจ้งเตือนอาชญากรรมของตำรวจในเขตเมืองบางแห่งจะเพิ่มกิจกรรมการลาดตระเวนของตำรวจ เนื่องจากการแจ้งอาชญากรรมถือเป็นการคาดการณ์ถึงกิจกรรมอาชญากรรมที่เพิ่มขึ้น อย่างไรก็ตาม การพิจารณาคดีอย่างเข้มข้นจะส่งผลให้อัตราการรายงานอาชญากรรมในพื้นที่นั้นสูงขึ้นเรื่อยๆ โดยไม่คำนึงถึงอัตราการเกิดอาชญากรรมที่แท้จริงของพื้นที่ใกล้เคียงเมื่อเทียบกับผู้อื่น “การเลือกคุณสมบัติ” เป็นอีกสาเหตุหนึ่งของการเลือกปฏิบัติที่ระบุโดย Barocas และ Selbst [ 8]. นี่เป็นกระบวนการที่ใช้โดยผู้ที่รวบรวมและวิเคราะห์ข้อมูลเพื่อตัดสินใจว่าแอตทริบิวต์หรือคุณลักษณะประเภทใดที่พวกเขาต้องการสังเกตและคำนึงถึงในกระบวนการตัดสินใจของพวกเขา ผู้เขียนแย้งว่าการเลือกคุณลักษณะมักเกี่ยวข้องกับการลดทอนของวัตถุ บุคคล หรือปรากฏการณ์ในโลกแห่งความเป็นจริงที่ซับซ้อนมากขึ้นซึ่งมุ่งหมายที่จะพรรณนาตราบเท่าที่ไม่สามารถคำนึงถึงคุณลักษณะทั้งหมดและปัจจัยทางสังคมหรือสิ่งแวดล้อมทั้งหมดที่เกี่ยวข้องได้ บุคคล [ 8 ].

d’Alessandro ระบุสาเหตุที่เป็นไปได้เพิ่มเติมอีกสองประการของการเลือกปฏิบัติซึ่งเกี่ยวข้องกับการกำหนดแบบจำลองที่ไม่ถูกต้อง นั่นคือ “รูปแบบการทำงานของชุดคุณลักษณะของแบบจำลองภายใต้การศึกษาซึ่งไม่ได้สะท้อนถึงแบบจำลองที่แท้จริง” [ 25 ] สิ่งเหล่านี้เป็นการระบุที่ไม่ถูกต้องของ “ฟังก์ชันต้นทุน” และ “ข้อผิดพลาดจากการละเลย” การระบุค่าที่ไม่ถูกต้องของ “ฟังก์ชันต้นทุน” หมายถึงความล้มเหลวในการพิจารณาน้ำหนักเพิ่มเติมที่มอบให้กับเหตุการณ์หรือคุณลักษณะที่น่าสนใจ (เช่น ประวัติอาชญากรรม) โดยนักวิทยาศาสตร์ข้อมูล d’Alessandro แย้งว่าตั้งแต่ “การเลือกปฏิบัติถูกบังคับใช้เมื่อคลาสที่ได้รับการคุ้มครองได้รับการกระทำเชิงลบที่ไม่สมควร” หาก “ข้อผิดพลาดเชิงบวกที่ผิดพลาดอาจทำให้เกิดอันตรายต่อบุคคลในคลาสที่ได้รับการคุ้มครอง” น้ำหนักของแอตทริบิวต์คือความไม่สมดุลด้วย ต้องคำนึงถึงผู้อื่น [ 25]. “ข้อผิดพลาดจากการละเลย” เป็นอีกรูปแบบหนึ่งของการกำหนดฟังก์ชันต้นทุนที่ไม่ถูกต้อง ซึ่งเกิดขึ้นเมื่อคำที่ลงโทษการเลือกปฏิบัติถูกละเลยหรือละเว้นจากแบบจำลอง พูดง่ายๆ ก็คือ แบบจำลองไม่ได้คำนึงถึงความแตกต่างในวิธีที่อัลกอริธึมจำแนกคลาสที่ได้รับการป้องกันและไม่ได้รับการป้องกัน [ 25 ]

สุดท้าย บทความที่ได้รับการตรวจสอบยังเน้นว่าการวิเคราะห์อัลกอริธึมสามารถเป็นเครื่องมือที่ยอดเยี่ยมและเป็นนวัตกรรมใหม่สำหรับการเลือกปฏิบัติโดยสมัครใจโดยตรงได้อย่างไร การปฏิบัตินี้ ซึ่งนิยามว่าเป็น “การปกปิด” เกี่ยวข้องกับการแสวงประโยชน์โดยเจตนาของกลไกที่อธิบายไว้ข้างต้นเพื่อกระทำการกีดกันการเลือกปฏิบัติและไม่เป็นธรรม แนวทางปฏิบัติที่พบบ่อยที่สุดของการปิดบังคือการใช้พร็อกซีโดยเจตนาเป็นตัวบ่งชี้ลักษณะที่ละเอียดอ่อน [ 8 , 45 , 62 , 93 , 95 ]

การแบ่งส่วนดิจิทัล
เราระบุเอกสาร 9 ฉบับที่กล่าวถึงความเหลื่อมล้ำทางดิจิทัล กล่าวคือ ช่องว่างระหว่างผู้ที่มีการเข้าถึงอินเทอร์เน็ต คอมพิวเตอร์ และสมาร์ทโฟนอย่างต่อเนื่องและพร้อมใช้ กับผู้ที่ไม่ได้ทำ ซึ่งอาจเป็นสาเหตุของความไม่เท่าเทียมกัน ความอยุติธรรม หรือการเลือกปฏิบัติ ขาดทรัพยากรหรือทักษะในการคำนวณ อายุที่มากขึ้น ที่ตั้งทางภูมิศาสตร์ และรายได้ต่ำถูกระบุว่าเป็น

สาเหตุที่เป็นไปได้ของการแบ่งดิจิทัลนี้ [ 8 , 18 , 60 ] เอกสารสองฉบับ [ 49 , 74 ] กล่าวถึง “การยกเว้นข้อมูลขนาดใหญ่” ที่อ้างถึงบุคคลเหล่านั้น “ซึ่งข้อมูลไม่ได้ถูกรวบรวมหรือวิเคราะห์เป็นประจำเพราะพวกเขาไม่ได้มีส่วนร่วมในแนวทางปฏิบัติในการสร้างข้อมูลเป็นประจำ” [ 49 ] ในบันทึกเดียวกัน Bakken และ Reame [ 6] แย้งว่าข้อมูลส่วนใหญ่รวบรวมมาจากคนผิวขาวที่มีการศึกษาโดยละทิ้งชนกลุ่มน้อยทางเชื้อชาติเช่นชาวลาติน Boyd และ Crawford หารือเกี่ยวกับการสร้างความแตกแยกทางดิจิทัลใหม่ โดยโต้แย้งว่าการเลือกปฏิบัติอาจเกิดขึ้นเนื่องจาก (1) ความแตกต่างในการเข้าถึงข้อมูลและทักษะในการประมวลผล—ความสมบูรณ์ของ Big Data และ Big Data ที่ยากจน และเนื่องจาก (2) ความแตกต่างทางเพศตราบใดที่นักวิจัยส่วนใหญ่ มีทักษะในการคำนวณเป็นผู้ชาย [ 12 ] สุดท้าย โคเฮนและคณะ [ 22 ] อธิบายว่าการใช้แบบจำลองการทำนายในเชิงพาณิชย์จะละทิ้งกลุ่มเสี่ยงเช่นคนพิการหรือความสามารถในการตัดสินใจที่จำกัดและผู้ป่วยที่มีความเสี่ยงสูง

การเชื่อมโยงและการรวมข้อมูล
เอกสารสี่ฉบับกล่าวถึงการเชื่อมโยงข้อมูล กล่าวคือ ความเป็นไปได้ในการรับ เชื่อมโยง และเปิดเผยข้อมูลส่วนบุคคลและข้อมูลที่ละเอียดอ่อนโดยอัตโนมัติว่าเป็นสาเหตุสำคัญของการเลือกปฏิบัติ บทความสองบทความ [ 19 , 91 ] อธิบายว่าการใช้บันทึกสุขภาพอิเล็กทรอนิกส์อาจส่งผลให้มีการเปิดเผยข้อมูลที่ละเอียดอ่อนโดยอัตโนมัติโดยปราศจากข้อตกลงที่ชัดแจ้งของผู้ป่วยหรือเพื่อระบุตัวตนซ้ำ คนอื่น ๆ [ 64 , 74 ] ยังเน้นว่าการเลือกปฏิบัติไม่ได้ถูกสร้างขึ้นโดยระบบการเก็บรวบรวมข้อมูล (เช่น การลงทะเบียนทางสังคมและสุขภาพ) ในตัวมันเอง แต่ทำได้ง่ายขึ้นโดยการเชื่อมโยงและศักยภาพในการรวบรวมที่ฝังอยู่ในข้อมูล

วิธีแก้ปัญหาที่แนะนำ
เอกสารดังกล่าวได้เสนอแนะกลยุทธ์ต่างๆ เพื่อป้องกันการเลือกปฏิบัติและความไม่เท่าเทียมกันในการวิเคราะห์ข้อมูล ตั้งแต่โซลูชันที่ใช้คอมพิวเตอร์และอัลกอริทึม ไปจนถึงการรวมเอาการมีส่วนร่วมของมนุษย์และการกำกับดูแล (ดูตารางที่ 5 )

ตารางที่ 5 แนวทางแก้ไขปัญหาการเลือกปฏิบัติใน Big Data
ตารางขนาดเต็ม
วิทยาการคอมพิวเตอร์เชิงปฏิบัติและการแก้ปัญหาทางเทคโนโลยี
บทความบางบทความที่เขียนโดยผู้เชี่ยวชาญด้านไอทีได้เสนอแนะวิธีแก้ปัญหาด้านวิทยาการคอมพิวเตอร์ที่ใช้งานได้จริง กล่าวคือ การพัฒนาวิธีการที่คำนึงถึงการเลือกปฏิบัติ เพื่อนำไปใช้ในระหว่างการพัฒนาแบบจำลองอัลกอริธึม เทคนิคเหล่านี้รวมถึง: ก่อน – การประมวลผลวิธีการที่เกี่ยวข้องกับการฆ่าเชื้อหรือการบิดเบือนของชุดข้อมูลการฝึกอบรมที่จะลบอคติที่เป็นไปได้เพื่อป้องกันไม่ให้รูปแบบใหม่จากการเรียนรู้พฤติกรรมการเลือกปฏิบัติ (เช่น [ 33 , 43 ] ใน – การประมวลผลเทคนิคที่ให้การ การปรับเปลี่ยนอัลกอริธึมการเรียนรู้ผ่านการประยุกต์ใช้การทำให้เป็นมาตรฐานกับแบบจำลองการเลือกปฏิบัติที่น่าจะเป็นไปได้ [ 43]) เช่น การรวมแอตทริบิวต์ที่ละเอียดอ่อนเพื่อหลีกเลี่ยงการคาดการณ์ที่เลือกปฏิบัติ [ 66 , 95 ] หรือการเพิ่มแบบสุ่มเพื่อหลีกเลี่ยงความลำเอียงของแบบจำลองที่มากเกินไปหรือซ่อนเร้น [ 45 ]; โพสต์ – การประมวลผลวิธีการที่เกี่ยวข้องกับการตรวจสอบรูปแบบการทำเหมืองข้อมูลสกัดสำหรับรูปแบบการจำแนกและในที่สุดการรักษาสุขอนามัยของพวกเขา [ 34 ] ตามเส้นเหล่านี้ [ 25] เสนอแนะให้ใช้กระบวนการตรวจสอบโดยคำนึงถึงการเลือกปฏิบัติโดยรวม ซึ่งเกี่ยวข้องกับการผสมผสานที่สอดคล้องกันของวิธีการก่อน ในกระบวนการ และหลังการประมวลผลทั้งหมดเพื่อหลีกเลี่ยงการเลือกปฏิบัติ เอกสารหลายฉบับระบุว่าการนำความโปร่งใสของกระบวนการขุดข้อมูลไปใช้สามารถช่วยหลีกเลี่ยงความอยุติธรรมและอันตรายได้อย่างไร ข้อเสนอแนะเชิงปฏิบัติเพื่อเสริมความโปร่งใสในการขุดข้อมูลรวมถึงการพัฒนาอัลกอริธึมที่ตีความได้ซึ่งจะให้คำอธิบายเกี่ยวกับขั้นตอนเชิงตรรกะที่อยู่เบื้องหลังการจำแนกประเภทบางอย่าง [ 45 , 73 ] และการสร้างแบบจำลองที่โปร่งใสซึ่งจะช่วยให้บุคคลเห็นล่วงหน้าว่าพฤติกรรมและพฤติกรรมของพวกเขาเป็นอย่างไร ตัวเลือกจะถูกตีความโดยอัลกอริทึมหรือโครงสร้างพื้นฐาน [ 21 , 35]. อีกวิธีหนึ่งคือการเพิ่มประสิทธิภาพของกลยุทธ์การรักษาความเป็นส่วนตัวที่เหมาะสม เนื่องจากเป็นไปไม่ได้ที่จะขจัดความเป็นไปได้ของการเลือกปฏิบัติในการทำเหมืองข้อมูล หากการทำเหมืองข้อมูลป้องกันการเลือกปฏิบัติไม่ได้รวมเข้ากับแบบจำลองการทำเหมืองข้อมูลการรักษาความเป็นส่วนตัว [ 34 ] สุดท้าย เอกสารฉบับหนึ่งได้เสนอแนะการส่งเสริมการวิเคราะห์ความเป็นธรรมเชิงสำรวจที่สามารถนำมาใช้เพื่อสร้างความรู้เกี่ยวกับกลไกและตรรกะที่อยู่เบื้องหลังการตัดสินใจของแมชชีนเลิร์นนิง [ 84 ]

การแก้ปัญหาทางกฎหมาย
การบังคับใช้กฎหมายว่าด้วยการปกป้องข้อมูลและการเลือกปฏิบัติเป็นข้อเสนอแนะทั่วไปอีกประการหนึ่งในเอกสารต่างๆ จากประเทศสหรัฐอเมริกา Kuempel [ 46 ] เสนอแนะว่าการประสานกันของกฎหมายคุ้มครองข้อมูลที่แข็งแกร่งกว่าในภาคส่วนต่างๆ ในสหรัฐอเมริกา อาจช่วยลดการเลือกปฏิบัติในพื้นที่ที่มีการควบคุม เช่น การตลาดออนไลน์และนายหน้าข้อมูล ผู้เขียนคนหนึ่ง [ 62 ] แย้งว่าควรวางนโยบายในการจำกัดการใช้ข้อมูล ข้อจำกัดดังกล่าวควรจำกัดหรือปฏิเสธการเปิดเผยข้อมูลที่ละเอียดอ่อนในบริบทเฉพาะ (เช่น ข้อมูลด้านสุขภาพในการจ้างงาน) หรือแม้แต่ปฏิเสธการใช้ข้อมูลเฉพาะในบริบทที่มีการเปิดเผยข้อมูลที่ละเอียดอ่อนแล้ว หากการใช้ดังกล่าวอาจก่อให้เกิดอันตรายต่อบุคคล (เช่น การใช้ ข้อมูลสุขภาพเพื่อเพิ่มเบี้ยประกัน) สุดท้าย บทความหนึ่ง [35 ] เสนอแนวคิดของ “รหัสเป็นกฎหมาย” นั่นคือการเปลี่ยนจากกฎหมายเขียนเป็นกฎหมายคำนวณ ซึ่งหมายถึงการเปล่งเสียงของบรรทัดฐานทางกฎหมายเฉพาะในเทคโนโลยีดิจิทัลผ่านการใช้ซอฟต์แวร์

โซลูชั่นที่เน้นมนุษย์เป็นศูนย์กลาง
การรักษามนุษย์ให้อยู่ในวงจรของการทำเหมืองข้อมูลเป็นอีกคำแนะนำหนึ่ง ตามรายงานบางฉบับ การกำกับดูแลและการกำกับดูแลของมนุษย์มีความสำคัญอย่างยิ่งต่อการปรับปรุงความเป็นธรรม เนื่องจากมนุษย์สามารถสังเกตเห็นได้ว่าปัจจัยสำคัญที่มองข้ามไปโดยไม่คาดคิดหรือคุณลักษณะที่ละเอียดอ่อนมีความสัมพันธ์อย่างไม่เหมาะสม [ 11 , 25 ] วิธีแก้ปัญหาอื่นๆ ที่รวมถึงการมีส่วนร่วมของมนุษย์ ได้แก่ (ก) การมีส่วนร่วมของบุคคลที่สามที่เชื่อถือได้ในการจัดเก็บข้อมูลที่ละเอียดอ่อนและกฎในการเปิดเผยข้อมูลของตนต่อบริษัท [ 84 ] หรือดูแลและประเมินการทำเหมืองข้อมูลที่น่าสงสัยและการจัดหมวดหมู่ [ 54]; (b) การมีส่วนร่วมของผู้มีส่วนได้ส่วนเสียที่เกี่ยวข้องทั้งหมดที่เกี่ยวข้องกับการตัดสินใจหรือกระบวนการจัดทำโปรไฟล์—เช่น สถาบันดูแลสุขภาพ, แพทย์, นักวิจัย, หัวข้อการวิจัย, บริษัทประกันภัย และนักวิทยาศาสตร์ข้อมูล—ในการอภิปรายสหสาขาวิชาชีพเกี่ยวกับการสร้างทฤษฎีที่ครอบคลุม กรอบการทำงานเพื่อควบคุมการทำเหมืองข้อมูลและส่งเสริมการดำเนินการตามขั้นตอนวิธีที่เป็นธรรม [ 22 ]; (c) การดำเนินการตามกลยุทธ์เพื่อให้ความรู้แก่นักวิทยาศาสตร์ข้อมูลในการสร้างแบบจำลองที่เหมาะสม เช่น การสร้างแพลตฟอร์มฐานความรู้เพื่อความเป็นธรรมในการขุดข้อมูลที่นักวิทยาศาสตร์ด้านข้อมูลสามารถตรวจสอบได้ในกรณีที่พบว่ามีความสัมพันธ์กันที่เป็นปัญหา และ (ง) การดำเนินการตามความยืดหยุ่นและดุลยพินิจในระบบการเปิดเผย EHR เพื่อหลีกเลี่ยงความอัปยศจากการเปิดเผยข้อมูลส่วนบุคคลและข้อมูลส่วนตัว [37 ].

อุปสรรคในการทำเหมืองข้อมูลอย่างยุติธรรม
เอกสารหลายฉบับอธิบายการตัดสินใจโดยใช้อัลกอริธึมเป็นระบบกล่องดำที่มองเห็นอินพุตและเอาต์พุตของอัลกอริธึม แต่กระบวนการภายในยังไม่ทราบ [ 13 , 21 , 25 ] ส่งผลให้ขาดความโปร่งใสเกี่ยวกับวิธีการและตรรกะเบื้องหลังการให้คะแนนและ ระบบการทำนาย [ 35 , 48 , 54 , 92 ] เหตุผลเบื้องหลัง

ความทึบของการตัดสินใจโดยอัตโนมัติมีหลายด้าน: ประการแรก อัลกอริธึมอาจใช้ชุดข้อมูลขนาดใหญ่และซับซ้อนมากซึ่งไม่สามารถตีความได้กับหน่วยงานกำกับดูแล [ 25 ] ซึ่งมักขาดความรู้ด้านวิทยาการคอมพิวเตอร์ที่จำเป็นในการทำความเข้าใจกระบวนการอัลกอริธึม [ 73 ]; ประการที่สอง การตัดสินใจโดยอัตโนมัติอาจอยู่เหนือความเข้าใจของมนุษย์เนื่องจากอัลกอริธึมไม่ได้ใช้ทฤษฎีหรือบริบทเหมือนในการตัดสินใจโดยมนุษย์ทั่วไป [ 58 ]; และสุดท้าย กระบวนการอัลกอริทึมของบริษัทหรือบริษัทอาจอยู่ภายใต้สิทธิ์ในทรัพย์สินทางปัญญาหรืออยู่ภายใต้ข้อกำหนดความลับทางการค้า [ 35 ] หากไม่มีข้อมูลที่โปร่งใสเกี่ยวกับวิธีการทำงานของอัลกอริธึมและกระบวนการ แทบจะเป็นไปไม่ได้เลยที่จะ [ 44] ประเมินความเป็นธรรมของอัลกอริทึมหรือค้นหารูปแบบการเลือกปฏิบัติในระบบ [ 45 ]

อคติของมนุษย์ถูกระบุว่าเป็นอุปสรรคสำคัญอีกประการหนึ่งของการทำเหมืองข้อมูลที่เป็นธรรม อัตวิสัยของมนุษย์เป็นหัวใจสำคัญของการออกแบบอัลกอริธึมการทำเหมืองข้อมูล เนื่องจากการตัดสินใจเกี่ยวกับคุณลักษณะที่จะถูกนำมาพิจารณาและจะถูกละเว้นนั้นขึ้นอยู่กับการตีความของมนุษย์ [ 12 ] และจะสะท้อนถึงค่าโดยปริยายหรือชัดแจ้งของค่านิยมเหล่านี้อย่างหลีกเลี่ยงไม่ได้ นักออกแบบ [ 1 ]

การทำเหมืองข้อมูลอัลกอริธึมยังก่อให้เกิดความท้าทายด้านแนวคิดอย่างมาก เอกสารหลายฉบับอ้างว่าการตัดสินใจโดยอัตโนมัติและการทำโปรไฟล์กำลังเปลี่ยนแนวความคิดเรื่องการเลือกปฏิบัติ เกินกว่าคำจำกัดความที่กฎหมายยอมรับ ในสหรัฐอเมริกา (US) ตัวอย่างเช่น Barocas และ Selbst [ 8 ] อ้างว่าอัลกอริธึมอคติและระบบอัตโนมัติกำลังทำให้แนวคิดของแรงจูงใจ ความตั้งใจ และความรู้ไม่ชัดเจน ทำให้ยากสำหรับหลักคำสอนของสหรัฐฯ เกี่ยวกับผลกระทบที่แตกต่างกันและการปฏิบัติที่แตกต่างกัน ประเมินและปราบปรามสาเหตุของการเลือกปฏิบัติด้วยอัลกอริธึม หนึ่งบทความ [ 48] การอภิปรายเกี่ยวกับกฎระเบียบของสหภาพยุโรป (EU) แย้งว่าจำเป็นต้องคิดใหม่เกี่ยวกับการเลือกปฏิบัติในบริบทของการทำโปรไฟล์ที่ขับเคลื่อนด้วยข้อมูล เนื่องจากการผลิตหมวดหมู่ตามอำเภอใจในเทคโนโลยีการขุดข้อมูลและความสัมพันธ์อัตโนมัติของคุณลักษณะของแต่ละบุคคลโดยอัลกอริทึมนั้นแตกต่างจากแบบดั้งเดิม การทำโปรไฟล์ซึ่งมีพื้นฐานมาจากการสร้างห่วงโซ่เชิงสาเหตุซึ่งพัฒนาโดยตรรกะของมนุษย์ บางบทความยังชี้ให้เห็นว่าแนวคิดเช่น “ตัวตน” และ “กลุ่ม” กำลังถูกเปลี่ยนแปลงโดยเทคโนโลยีการทำเหมืองข้อมูล de Vries แย้งว่าอัตลักษณ์ส่วนบุคคลมีรูปร่างมากขึ้นโดยอัลกอริธึมการทำโปรไฟล์และความฉลาดรอบข้างในแง่ของการจัดกลุ่มที่เพิ่มขึ้นซึ่งสร้างขึ้นตามความสัมพันธ์โดยพลการของอัลกอริธึมซึ่งจัดเรียงบุคคลให้เป็น “ชุมชน” หรือ “ฝูงชน” เสมือนจริง ( 27)]. ประเภทของ “กลุ่ม” หรือ “ฝูงชน” นี้แตกต่างจากความเข้าใจดั้งเดิมของกลุ่มเนื่องจากผู้ที่เกี่ยวข้องใน “กลุ่ม” อาจไม่ทราบ (1) การเป็นสมาชิกกลุ่มนั้น (2) เหตุผลเบื้องหลังการเชื่อมโยงกับ กลุ่มนั้นและที่สำคัญที่สุด (3) ผลของการเป็นส่วนหนึ่งของกลุ่มนั้น [ 54 ] อีกสองแนวคิดกำลังถูกเปลี่ยนโฉมหน้าด้วยเทคโนโลยีข้อมูล ประการแรกคือแนวคิดของเส้นขอบ [ 1] ซึ่งไม่ใช่ตัวแบ่งทางกายภาพและทางสถิตระหว่างประเทศอีกต่อไป แต่ได้กลายเป็นหน่วยงานที่แพร่หลายและมองไม่เห็นซึ่งฝังอยู่ในกระบวนการของระบบราชการและการบริหารของรัฐเนื่องจากเครื่องมือเฝ้าระวังข้อมูลขนาดใหญ่เช่นหนังสือเดินทางอิเล็กทรอนิกส์และมาตรการรักษาความปลอดภัยสนามบิน ประการที่สอง คือ แนวคิดเรื่องความทุพพลภาพ ซึ่งจำเป็นต้องขยายให้ครอบคลุมถึงโรคและสภาวะสุขภาพทั้งหมด เช่น โรคอ้วน ความดันโลหิตสูง และภาวะหัวใจล้มเหลวเล็กน้อย ซึ่งอาจส่งผลให้เกิดการเลือกปฏิบัติจากตัวจำแนกอัตโนมัติผ่านอัลกอริทึมที่สัมพันธ์กับโรคที่ร้ายแรงกว่า [ 37 , 38 ].

อุปสรรคสุดท้ายที่ระบุในวรรณคดีมีลักษณะทางกฎหมาย ตามที่ผู้เขียนบางคนกล่าว กฎหมายต่อต้านการเลือกปฏิบัติและการปกป้องข้อมูลในปัจจุบัน ทั้งในสหภาพยุโรปและสหรัฐอเมริกา ยังไม่พร้อมที่จะจัดการกับกรณีของการเลือกปฏิบัติที่เกิดจากเทคโนโลยีดิจิทัล [ 8 ] Kroll และคณะ [ 45 ] อ้างว่ากฎหมายต่อต้านการเลือกปฏิบัติในปัจจุบันอาจป้องกันผู้ใช้อัลกอริธึมจากการแก้ไขไปจนถึงการตรวจสอบอัลกอริธึมอย่างถูกกฎหมายหลังจากข้อเท็จจริงเกี่ยวกับการเลือกปฏิบัติได้เกิดขึ้น ทำให้การพัฒนารูปแบบการต่อต้านการเลือกปฏิบัติในอดีตที่กดดันยิ่งขึ้น คุมเพล [ 46] แย้งว่ากฎหมายคุ้มครองข้อมูลมีความเป็นสาขามากเกินไปและไม่ได้ให้การป้องกันเพียงพอจากการเลือกปฏิบัติในภาคส่วนเช่นการตลาด เอกสารบางฉบับเน้นถึงความนัยของการดำเนินการตามข้อบังคับการปกป้องข้อมูลของยุโรป โดยเฉพาะกฎระเบียบให้ความคุ้มครองข้อมูลส่วนบุคคลของผู้บริโภค (GDPR) ฉบับใหม่ของเดือนพฤษภาคม 2018 ผู้เขียนได้เน้นย้ำว่าข้อกำหนดในการปกป้องข้อมูล เช่น การลดขนาดการรวบรวมข้อมูลและการจำกัดการใช้ข้อมูลส่วนบุคคล อาจส่งผลให้เกิดอุปสรรคในการพัฒนารูปแบบการต่อต้านการเลือกปฏิบัติที่ต้องการการรวมข้อมูลที่ละเอียดอ่อนเพื่อหลีกเลี่ยงผลการเลือกปฏิบัติ [ 35 , 95 ] (ดูตารางที่ 6 )

ตารางที่ 6 อุปสรรคต่อการวิเคราะห์ข้อมูลอย่างยุติธรรม
ตารางขนาดเต็ม
การนำเทคโนโลยีบิ๊กดาต้ามาใช้ให้เกิดประโยชน์
สุดท้าย เอกสารหลายฉบับยังได้อธิบายว่าเทคโนโลยีการทำเหมืองข้อมูลเป็นเครื่องมือทางปฏิบัติที่สำคัญในการต่อต้านหรือป้องกันความไม่เท่าเทียมกันและการเลือกปฏิบัติได้อย่างไร (ดูตารางที่ 7 )

ตารางที่ 7 การนำการวิเคราะห์ข้อมูลไปใช้ให้เกิดประโยชน์
ตารางขนาดเต็ม
การทำเหมืองข้อมูลกล่าวเพื่อส่งเสริมความเที่ยงธรรมในการจำแนกประเภทและการทำโปรไฟล์ เนื่องจากการตัดสินใจทำโดยกระบวนการอัลกอริธึมที่เป็นทางการ เป็นกลาง และต่อเนื่อง โดยมีพื้นฐานเชิงประจักษ์ที่เชื่อถือได้มากกว่าการตัดสินใจของมนุษย์ [ 8 ] คุณลักษณะของความเที่ยงธรรมนี้อาจจำกัดข้อผิดพลาดและความลำเอียงของมนุษย์ ตามรายงานบางฉบับ การขุดข้อมูลอัตโนมัติสามารถใช้เพื่อค้นหาและประเมินการปฏิบัติที่เลือกปฏิบัติในการจำแนกประเภทและการทำเหมืองข้อมูล ผ่านการสร้างแบบจำลองอัลกอริทึมที่คำนึงถึงการเลือกปฏิบัติ (เช่น [ 10 , 71]) บุคคลที่สงสัยว่าถูกเลือกปฏิบัติสามารถช่วยในการระบุและประเมินการเลือกปฏิบัติทางตรง/ทางอ้อม การเล่นพรรคเล่นพวกหรือการยืนยัน และผู้มีอำนาจตัดสินใจ (เช่น นายจ้าง ผู้จัดการบริษัทประกันภัย และอื่นๆ) อาจได้รับการคุ้มครองจากการเลือกปฏิบัติโดยมิชอบ ข้อกล่าวหา เอกสารบางฉบับยังเน้นว่าศักยภาพของเทคโนโลยีบิ๊กดาต้าในการบูรณาการข้อมูลทางเศรษฐกิจและสังคม ข้อมูลมือถือ และข้อมูลทางภูมิศาสตร์สามารถส่งเสริมการใช้งานที่เท่าเทียมกันและเป็นประโยชน์ในภาคส่วนต่างๆ ในด้านการดูแลสุขภาพ ตัวอย่างเช่น การรวมข้อมูลด้านการดูแลสุขภาพกับข้อมูลเชิงบริบทเชิงพื้นที่ อาจช่วยระบุพื้นที่และกลุ่มที่ต้องการการส่งเสริมสุขภาพ [ 47]; นอกจากนี้ การใช้บิ๊กดาต้า การทำโปรไฟล์และการจำแนกประเภทสามารถส่งเสริมความเท่าเทียมโดยคำนึงถึงความแตกต่างด้านสุขภาพในการวิจัย เนื่องจากสามารถส่งเสริมการดำเนินการตามกลยุทธ์ที่ปรับให้เหมาะสมโดยคำนึงถึงเชื้อชาติ สภาพความเป็นอยู่ และวิถีชีวิตโดยทั่วไปของแต่ละบุคคล [ 6 ] การพัฒนาเศรษฐกิจและเมืองเป็นอีกพื้นที่หนึ่งที่การทำเหมืองข้อมูลสามารถช่วยส่งเสริมความเท่าเทียม การรวมการวิเคราะห์จากกิจกรรมโทรศัพท์มือถือและปัจจัยทางเศรษฐกิจและสังคมภายในข้อมูลทางภูมิศาสตร์สามารถช่วยติดตามและประเมินความไม่เท่าเทียมกันของโครงสร้างทางสังคมเพื่อส่งเสริมการดำเนินการพัฒนาเมืองที่เท่าเทียมกันและเติบโต [ 55 , 83 , 85 ] การย้ายถิ่นก็ได้

ได้รับประโยชน์จากการใช้เทคโนโลยีบิ๊กดาต้า เนื่องจากสามารถให้ข้อมูลที่ถูกต้องมากขึ้นแก่นักวิชาการและนักเคลื่อนไหวเกี่ยวกับกระแสการย้ายถิ่น ดังนั้นจึงเตรียมและปรับปรุงกระบวนการด้านมนุษยธรรมได้ [ 1 ] ในที่สุด เอกสารสองฉบับยังได้กล่าวถึงอิทธิพลเชิงบวกของโซเชียลมีเดีย [ 59 ] วิเคราะห์ว่าการทำเหมืองข้อความสามารถใช้เพื่อประเมินระดับและการแพร่กระจายของการเลือกปฏิบัติที่เกี่ยวข้องกับผู้ที่ได้รับผลกระทบจากการติดเชื้อไวรัสภูมิคุ้มกันบกพร่องของมนุษย์ (HIV) และกลุ่มอาการภูมิคุ้มกันบกพร่องที่ได้รับ (เอดส์) ได้อย่างไร ในโซเชียลมีเดียยอดนิยมเช่น Facebook และในขณะเดียวกันก็ใช้แคมเปญสร้างความตระหนักเพื่อกระจายความอดทน บทความอื่น [ 18] อ้างว่าสามารถใช้โซเชียลมีเดียเพื่อเพิ่มการมีส่วนร่วมของผู้ที่ได้รับการดูแลแบบประคับประคองในเด็กซึ่งเป็นกลุ่มเสี่ยงโดยเฉพาะในการวิจัย

การอภิปราย
เอกสารที่ตรวจสอบส่วนใหญ่ (49 จาก 61 รายการ) มีอายุจาก 5 ปีที่ผ่านมา นี่แสดงให้เห็นว่าแม้ว่าบิ๊กดาต้าจะเป็นคำศัพท์ที่ได้รับความนิยมในวรรณคดีทางวิทยาศาสตร์มาตั้งแต่ปี 2554 [ 16 ] แต่ปัญหาการเลือกปฏิบัติด้วยอัลกอริธึมได้กลายเป็นที่สนใจเฉพาะเมื่อเร็ว ๆ นี้ ร่วมกับการตีพิมพ์รายงานของทำเนียบขาวประจำปี 2557 [ 65 ] ดังนั้น การไตร่ตรองทางวิชาการเกี่ยวกับปัญหานี้จึงปรากฏค่อนข้างช้า ส่งผลให้ผลลัพธ์ที่อาจเลือกปฏิบัติของการขุดข้อมูลไม่ถูกแก้ไขเป็นเวลานาน นอกจากนี้ สอดคล้องกับการศึกษาอื่นๆ [ 56] การทบทวนของเราระบุว่าในขณะที่การอภิปรายเชิงทฤษฎีในหัวข้อนี้กำลังจะเกิดขึ้น แต่การศึกษาเชิงประจักษ์เกี่ยวกับการเลือกปฏิบัติในการทำเหมืองข้อมูล ส่วนใหญ่ยังขาดอยู่ทั้งในด้านกฎหมายและสังคมศาสตร์ นี่เป็นปัญหาอย่างมากโดยเฉพาะอย่างยิ่งในแง่ของรูปแบบใหม่ของการรักษาที่แตกต่างกันซึ่งเกิดขึ้นกับ “การสร้างข้อมูล” ที่เพิ่มขึ้นของสังคม การเลือกปฏิบัติในการทำนายราคาและสุขภาพ (เช่น ในกรมธรรม์ประกันภัย) ตัวอย่างเช่น ไม่ผิดกฎหมาย แต่อาจกลายเป็นปัญหาทางจริยธรรม หากบุคคลถูกปฏิเสธไม่ให้เข้าถึงสินค้าหรือบริการที่จำเป็นตามรายได้หรือวิถีชีวิตของพวกเขา จำเป็นต้องมีการศึกษาตามหลักฐานเพิ่มเติมเกี่ยวกับการใช้แนวทางปฏิบัติเหล่านี้ที่เป็นอันตรายหากเราต้องการเข้าใจความซับซ้อนของปัญหานี้ในเชิงลึก นอกจากนี้, เป็นเรื่องที่น่าสนใจที่จะสังเกตว่าไม่มีรายงานใดที่ตรวจสอบการเลือกปฏิบัติที่เกี่ยวข้องกับสี่ V’s ของ Big Data เนื่องจากพวกเขาเน้นที่ประเด็นการจำแนกประเภทและอัลกอริทึมของการวิเคราะห์ข้อมูลมากขึ้น ดังนั้นจึงเป็นเรื่องสำคัญที่การศึกษาในอนาคตจะต้องคำนึงถึงปัญหาการเลือกปฏิบัติที่เป็นอันตรายซึ่งเกี่ยวข้องกับปัญหาเฉพาะที่เกี่ยวข้องกับลักษณะเฉพาะของ Big Data เช่น ความจริงของชุดข้อมูลและข้อจำกัดที่เกี่ยวข้องกับปริมาณข้อมูลสูง และ ความเร็วในการผลิต

แม้ว่าเอกสารส่วนใหญ่จะมีลักษณะทางทฤษฎี แต่คำว่าการเลือกปฏิบัติถูกนำเสนอเพื่ออธิบายตนเองและเชื่อมโยงกับแนวคิดอื่นๆ เช่น ความอยุติธรรม ความไม่เท่าเทียมกัน และการปฏิบัติที่ไม่เท่าเทียมกัน ยกเว้นเอกสารบางฉบับในด้านกฎหมายและวิทยาการคอมพิวเตอร์ การขาดคำจำกัดความการทำงานโดยรวมในวรรณคดีนี้เป็นปัญหาอย่างมาก ด้วยเหตุผลหลายประการ

ประการแรกเทคโนโลยีการทำเหมืองข้อมูลถูกสร้างขึ้นโดยเจตนาเพื่อจำแนก แยกแยะ แบ่งแยกบุคคล กลุ่ม หรือการกระทำ [ 8 ] การอภิปรายปัญหาการเลือกปฏิบัติที่ไม่เป็นธรรมโดยไม่มีคำจำกัดความที่ชัดเจนทำให้เกิดความสับสน การเลือกปฏิบัติในการทำเหมืองข้อมูล แท้จริงแล้ว ไม่ได้ผิดกฎหมายหรือผิดจรรยาบรรณ ตราบใดที่จำกัดตัวเองให้แยกแยะความแตกต่างระหว่างบุคคลที่มีคุณลักษณะต่างกัน [ 35]. ตัวอย่างเช่น การแยกความแตกต่างระหว่างผู้เยาว์กับผู้ใหญ่เป็นแนวปฏิบัติที่สังคมยอมรับและยอมรับตามกฎหมายว่าด้วย “การเลือกปฏิบัติที่เป็นกลาง” ตามความแตกต่างของอายุ (ในประเทศส่วนใหญ่ที่กำหนดอายุ 18 ปี) บุคคลจะได้รับการปฏิบัติที่ไม่เหมือนกัน ผู้ใหญ่มีสิทธิและหน้าที่แตกต่างจากผู้เยาว์ พวกเขาสามารถขับรถและลงคะแนนเสียงได้ พวกเขาถูกตัดสินในศาลที่ต่างกัน เป็นต้น ยิ่งกว่านั้น แม้แต่ความพยายามที่จะบรรลุความเท่าเทียมกันทางสังคม บางครั้งก็บ่งบอกถึงการปฏิบัติที่แตกต่าง ตัวอย่างเช่น ในกรณีของความเท่าเทียมทางเพศ อนุญาตให้ปฏิบัติต่อปัจเจกตามเพศที่แตกต่างกันได้ หากการรักษาดังกล่าวถูกนำมาใช้โดยมีเป้าหมายระยะยาวในการขจัดความเหลื่อมล้ำทางสังคม [ 87]. ดังนั้น หากนักวิจัยต้องการหารือเกี่ยวกับปัญหาการเลือกปฏิบัติในการทำเหมืองข้อมูล ความแตกต่างระหว่างการเลือกปฏิบัติที่เป็นอันตรายและไม่ยุติธรรมกับการเลือกปฏิบัติที่เป็นกลางหรือยุติธรรมจึงมีความสำคัญสูงสุด

ประการที่สอง หากไม่มีคำจำกัดความที่เพียงพอของการเลือกปฏิบัติ เป็นเรื่องยากสำหรับนักวิทยาศาสตร์คอมพิวเตอร์และโปรแกรมเมอร์ที่จะใช้อัลกอริธึมอย่างเหมาะสม ในความเป็นจริง เพื่อหลีกเลี่ยงการปฏิบัติที่ไม่เป็นธรรม วัดความเป็นธรรมและวัดปริมาณการเลือกปฏิบัติที่ผิดกฎหมาย [ 43 ] พวกเขาจำเป็นต้องแปลแนวคิดเรื่องการเลือกปฏิบัติให้เป็นชุดปฏิบัติการทางสถิติที่เป็นทางการ ความจำเป็นในความรู้จากผู้เชี่ยวชาญนี้อาจอธิบายได้ว่าทำไม เมื่อเทียบกับนักวิจัยคนอื่นๆ ในสาขานี้ นักวิทยาศาสตร์คอมพิวเตอร์จึงอยู่ในระดับแนวหน้าในการค้นหาคำนิยามที่ใช้งานได้

ถึงกระนั้น แม้จะจำเป็นต้องมีคำจำกัดความในการทำงานของการเลือกปฏิบัติ เราก็ไม่ควรลืมว่ามันยังคงเป็นแนวคิดทางจริยธรรมและสังคมที่เข้าใจยาก ซึ่งไม่สามารถและไม่ควรลดขนาดเป็นการวัดทางสถิติที่ “กลายเป็นหิน” ตามที่เห็นในการทบทวนของเรา การทำเหมืองข้อมูลได้ก่อให้เกิดรูปแบบใหม่ของการรักษาที่แตกต่างกัน เพื่อให้เข้าใจถึงความหมายของการเลือกปฏิบัติใหม่เหล่านี้อย่างเหมาะสม อาจจำเป็นต้องมีการทบทวนแนวคิดเรื่องการเลือกปฏิบัติที่ยุติธรรมและไม่เป็นธรรม เพื่อให้การอภิปรายเรื่องการเลือกปฏิบัติใน Big Data เป็นไปอย่างเปิดเผย สิ่งสำคัญคือต้องทำให้มนุษย์อยู่ในวงกว้าง

แนวทางปฏิบัติของการทำโปรไฟล์อัตโนมัติ การเรียงลำดับ และการตัดสินใจผ่านการทำเหมืองข้อมูล ได้รับการแนะนำด้วยแนวคิดเบื้องต้นที่ว่าเทคโนโลยีบิ๊กดาต้าเป็นเครื่องมือที่มีวัตถุประสงค์ที่สามารถเอาชนะอัตวิสัยและข้อผิดพลาดของมนุษย์ได้ ส่งผลให้มีความเป็นธรรมเพิ่มขึ้น [ 3 ] อย่างไรก็ตาม การทำเหมืองข้อมูลไม่สามารถปราศจากมนุษย์ได้อย่างสมบูรณ์ ไม่เพียงเพราะมนุษย์มักจะเสี่ยงที่จะบ่อนทำลายความเป็นธรรมและความเที่ยงธรรมที่สันนิษฐานไว้ของกระบวนการด้วยอคติในจิตใต้สำนึก ค่านิยมส่วนบุคคล หรือการไม่ใส่ใจ แต่ยังเป็นเพราะสิ่งเหล่านี้มีความสำคัญอย่างยิ่งเพื่อหลีกเลี่ยงความสัมพันธ์ที่ไม่เหมาะสม ด้วยเหตุนี้ เพื่อให้เกิดความเป็นธรรมในการทำเหมืองข้อมูล ดูเหมือนว่าเทคโนโลยีบิ๊กดาต้าจะเชื่อมโยงอย่างลึกซึ้งกับมิติแบบแบ่งขั้ว ซึ่งมนุษย์เป็นทั้งสาเหตุของข้อบกพร่องและผู้ดูแลการทำงานที่เหมาะสม

วิธีหนึ่งในการรักษามนุษย์ให้อยู่ในวงจรคือผ่านการออกกฎหมาย อย่างไรก็ตาม ผลลัพธ์ของเราแสดงให้เห็นว่าแม้ว่านักวิชาการด้านกฎหมายจะพยายามจัดการกับผลลัพธ์การเลือกปฏิบัติที่ไม่เป็นธรรมของรูปแบบใหม่ของการจัดทำโปรไฟล์ แต่บิ๊กดาต้ายังก่อให้เกิดความท้าทายที่สำคัญต่อการต่อต้านการเลือกปฏิบัติและกฎหมายคุ้มครองความเป็นส่วนตัว “แบบดั้งเดิม” เนื่องจากแนวคิดหลัก เช่น แรงจูงใจและความตั้งใจ ไม่ใช่ อยู่ได้นานขึ้น [ 8 ] ประเด็นหลักที่เกิดซ้ำในเอกสารหลายฉบับคือการที่กฎหมายมักจะขาดเบื้องหลังการพัฒนาทางเทคโนโลยี และในขณะที่ช่องว่างในการคุ้มครองทางกฎหมายนั้นมีความเป็นระบบ [ 35 ] การแก้ปัญหาทางกฎหมายที่ครอบคลุมสำหรับผลลัพธ์การเลือกปฏิบัติที่ไม่เป็นธรรมทั้งหมดของการทำเหมืองข้อมูลนั้นไม่สามารถทำได้ [ 45 ]

ในการตรวจสอบของเรา มีเอกสารเพียงไม่กี่ฉบับที่เสนอวิธีแก้ปัญหาทางกฎหมายในทางปฏิบัติสำหรับปัญหาการเลือกปฏิบัติที่ไม่เป็นธรรมในการขุดข้อมูล: ตัวอย่างเช่น งานวิจัยชิ้นหนึ่งที่สนับสนุนกฎที่บังคับใช้โดยทั่วไป [ 46 ] ในขณะที่อีกฉบับแนะนำการสร้างชุดของแบบอย่างที่สร้างขึ้นในเวลา ผ่านการพิจารณาเป็นรายๆ ไป [ 36 ] โซลูชันทั้งสองไม่สอดคล้องกับความเป็นจริงและความต้องการของการจัดการข้อมูล เนื่องจากมีความเข้มงวดเกินไป [ 46 ] หรือเฉพาะและยืดเยื้อเกินไป [ 36 ]

ผลลัพธ์ที่ไม่ดีนี้อาจเป็นผลมาจากลักษณะทางเทคนิคที่ซับซ้อนของการทำเหมืองข้อมูลและการกำหนดทางกฎหมายที่ซับซ้อนซึ่งแสดงถึงการเลือกปฏิบัติที่ไม่เป็นธรรมซึ่งกฎหมายควรห้ามไว้ กฎระเบียบให้ความคุ้มครองข้อมูลส่วนบุคคลของผู้บริโภคแห่งยุโรป(GDPR) ฉบับใหม่เป็นตัวอย่างที่ดีในเรื่องนี้ คุณสมบัติหลักสองประการของ GDPR ได้แก่: การลดขนาดข้อมูล (เช่น การเก็บรวบรวมข้อมูลและการประมวลผลควรเก็บไว้ให้น้อยที่สุด) และข้อจำกัดวัตถุประสงค์ (เช่น ข้อมูลควรได้รับการวิเคราะห์และประมวลผลเพื่อวัตถุประสงค์ที่รวบรวมเท่านั้น) เนื่องจากหลักการทั้งสองนี้ได้รับแรงบันดาลใจจากระเบียบข้อบังคับด้านความเป็นส่วนตัวของข้อมูลซึ่งกำหนดขึ้นในปี 1970 จึงไม่คำนึงถึงประเด็นสำคัญสองประการที่วิทยาการคอมพิวเตอร์ นักวิชาการด้านเทคนิค และกฎหมายหลายคนเคยกล่าวย้ำในช่วงไม่กี่ปีที่ผ่านมา [ 31]]: ประการแรก ด้วยเทคโนโลยีบิ๊กดาต้า ข้อมูลจะไม่ถูกเก็บรวบรวมเพื่อวัตถุประสงค์เฉพาะ ที่จำกัด และเฉพาะเจาะจง แต่จะรวบรวมเพื่อค้นพบรูปแบบและความสัมพันธ์ใหม่ที่คาดเดาไม่ได้ [ 53 ]; ประการที่สอง แบบจำลองการต่อต้านการเลือกปฏิบัติจำเป็นต้องมีการรวมข้อมูลที่ละเอียดอ่อนเพื่อตรวจจับและหลีกเลี่ยงผลการเลือกปฏิบัติ [ 95 ]

ปัญหาที่พบในการควบคุมการเลือกปฏิบัติอย่างเพียงพอใน Big Data โดยเฉพาะอย่างยิ่งจากมุมมองทางกฎหมาย อาจส่วนหนึ่งเกี่ยวข้องกับการขาดการเจรจาระหว่างสาขาวิชาต่างๆ ในความเป็นจริง วรรณกรรมที่ผ่านการตรวจสอบชี้ให้เห็นว่าในขณะที่การเลือกปฏิบัติอย่างไม่เป็นธรรมเป็นแนวคิดทางปรัชญาและกฎหมายที่ซับซ้อนซึ่งเก็บปัญหาสำหรับนักวิทยาศาสตร์ด้านข้อมูลที่ได้รับการฝึกอบรม [ 20 ] ในทางกลับกัน Big Data ค่อนข้างเป็นสาขาเทคโนโลยีดังนั้นนักปรัชญาและนักสังคมศาสตร์ และนักกฎหมายมักไม่เข้าใจถึงนัยของการสร้างแบบจำลองอัลกอริทึมสำหรับการเลือกปฏิบัติอย่างถ่องแท้เสมอไป [ 73 ]

การขาดความเข้าใจร่วมกันนี้ชี้ให้เห็นถึงความจำเป็นเร่งด่วนในการทำงานร่วมกันแบบสหสาขาวิชาชีพระหว่างสาขาต่างๆ เช่น ปรัชญา สังคมศาสตร์ กฎหมาย วิทยาการคอมพิวเตอร์ และวิศวกรรม แนวคิดเรื่องการทำงานร่วมกันระหว่างสาขาวิชาต่างๆ อันเนื่องมาจากการแพร่กระจายของเทคโนโลยีดิจิทัลไม่ใช่เรื่องใหม่ ตัวอย่างของสิ่งนี้สามารถพบได้ในแนวคิดของ “รหัสตามกฎหมาย” ที่เสนอโดยทั้ง Reidenberg และ Lessing ในช่วงปลายทศวรรษ 1990 ซึ่งแสดงถึงการออกแบบเทคโนโลยีดิจิทัลเพื่อรองรับบรรทัดฐานและกฎหมายเฉพาะ เช่น ความเป็นส่วนตัวและการต่อต้านการเลือกปฏิบัติ [ 50 , 68 ]. ตามที่แสดงโดยผลลัพธ์ของเรา (เช่น [ 25 , 42 , 43]) นักวิชาการจำนวนมากที่ต้องการใช้กฎการต่อต้านการเลือกปฏิบัติในรูปแบบอัลกอริทึมเพื่อหลีกเลี่ยงผลลัพธ์ที่เป็นอันตรายที่ไม่เป็นธรรม อย่างไรก็ตาม เอกสารบางฉบับได้แนะนำการสนทนาที่กว้างขึ้นและครอบคลุมระหว่างสาขาวิชาต่างๆ [ 22 , 31 , 45 ] อย่างไรก็ตาม วรรณคดียังขาดวิธีการที่เป็นรูปธรรมในการนำความเป็นสหสาขาวิชาชีพนี้ไปปฏิบัติ

สุดท้าย มีงานวิจัยบางชิ้นที่เน้นว่าเทคโนโลยีบิ๊กดาต้าอาจจัดการกับการเลือกปฏิบัติและส่งเสริมความเท่าเทียมกันในภาคส่วนต่างๆ เช่น การดูแลสุขภาพและการพัฒนาเมือง [ 6 , 18 , 47 ] อย่างไรก็ตาม การแทรกแซงดังกล่าวอาจส่งผลตรงกันข้ามและสร้างความเหลื่อมล้ำทางสังคมประเภทอื่นๆ โดยขยายการแบ่งแยกระหว่างผู้ที่เข้าถึงทรัพยากรดิจิทัลและผู้ที่ไม่สามารถเข้าถึง โดยพิจารณาจากรายได้ ชาติพันธุ์ อายุ ทักษะ และที่ตั้งทางภูมิศาสตร์ . เอกสารจำนวนมากที่ระบุถึงความเหลื่อมล้ำทางดิจิทัลเป็นสาเหตุหลักของความไม่เท่าเทียมกันบ่งชี้ว่า แม้จะมีความพยายามทั้งหมดเพื่อปรับปรุงการมีส่วนร่วมทางดิจิทัลทั่วโลก [ 89 , 90] ความเหลื่อมล้ำทางสังคมอันเนื่องมาจากการขาดการเข้าถึงเทคโนโลยีดิจิทัลกำลังเพิ่มขึ้นในหลายภาคส่วน รวมถึงสุขภาพ [ 88 ] การมีส่วนร่วม/การมีส่วนร่วมของประชาชน [ 9 ] และการพัฒนาโครงสร้างพื้นฐานสาธารณะ [ 60 , 79 ] นักวิชาการค่อนข้างจะสงสัยเกี่ยวกับการค้นหาวิธีแก้ปัญหานี้เนื่องจากภูมิทัศน์ทางเทคโนโลยีที่เปลี่ยนแปลงตลอดเวลาซึ่งสร้างปัญหาใหม่ในการรวมกลุ่ม [ 89 , 90 ] อย่างไรก็ตาม เนื่องจากมีความเป็นไปได้ที่มีแนวโน้มว่าเทคโนโลยีบิ๊กดาต้าจะนำไปใช้ประโยชน์ได้ การศึกษาเพิ่มเติมควรเน้นที่การวิเคราะห์และการนำการใช้งานเหมืองข้อมูลไปใช้งานอย่างยุติธรรม ในขณะที่พิจารณาและหลีกเลี่ยงการสร้างความแตกแยกใหม่

โดยสรุป จำเป็นต้องมีการวิจัยเพิ่มเติมเกี่ยวกับความท้าทายทางแนวคิดที่เทคโนโลยีบิ๊กดาต้าสร้างขึ้นในบริบทของการทำเหมืองข้อมูลและการเลือกปฏิบัติ การขาดคำศัพท์เฉพาะที่เพียงพอเกี่ยวกับการเลือกปฏิบัติทางดิจิทัลและการมีอยู่ของอคติแฝงที่อาจซ่อนเร้นรูปแบบถาวรของการรักษาที่แตกต่างกันตามแนวทางปฏิบัติที่เป็นมาตรฐาน แม้ว่าเอกสารสองสามฉบับจะกล่าวถึงหัวข้อของการแก้ไขแนวความคิดที่เป็นไปได้เกี่ยวกับการเลือกปฏิบัติและความเป็นธรรม [ 79 ] แต่ไม่มีการศึกษาใดที่ดำเนินการดังกล่าวอย่างละเอียดถี่ถ้วน

ข้อจำกัด
บทความที่ผ่านการตรวจสอบโดยเพื่อนทั้งหมด 61 บทความเป็นภาษาอังกฤษที่มีคุณสมบัติเหมาะสมเพื่อรวมและได้รับการประเมินเพิ่มเติม ดังนั้นจึงอาจเป็นไปได้ว่าการศึกษาในภาษาอื่นและวรรณคดีสีเทาที่เกี่ยวข้องถูกมองข้ามไป นอกเหนือจากข้อจำกัดเหล่านี้แล้ว นี่เป็นการศึกษาครั้งแรกที่สำรวจความสัมพันธ์ระหว่างข้อมูลขนาดใหญ่กับการเลือกปฏิบัติจากมุมมองของสหสาขาวิชาชีพอย่างครอบคลุม

บทสรุป
Big Data ให้คำมั่นสัญญาที่ดี แต่ยังก่อให้เกิดความเสี่ยงอย่างมาก การทบทวนวรรณกรรมเน้นว่าการเลือกปฏิบัติอย่างไม่เป็นธรรมเป็นหนึ่งในปัญหาเร่งด่วนที่สุด แต่ในขณะเดียวกันปัญหาการทำเหมืองข้อมูลมักถูกประเมินต่ำเกินไป เอกสารจำนวนมากได้เสนอวิธีแก้ปัญหาเพื่อหลีกเลี่ยงการเลือกปฏิบัติในการใช้เทคโนโลยีข้อมูล แม้ว่ากลยุทธ์ที่แนะนำส่วนใหญ่เป็นวิธีการคำนวณ/อัลกอริธึมที่ใช้งานได้จริง เอกสารจำนวนมากได้แนะนำวิธีแก้ปัญหาของมนุษย์ ความโปร่งใสเป็นวิธีแก้ปัญหาที่แนะนำโดยทั่วไปเพื่อเพิ่มความเป็นธรรมของอัลกอริทึม การปรับปรุงความโปร่งใสของอัลกอริทึมและการแก้ไขปัญหากล่องดำอาจเป็นแนวทางที่ดีที่สุดในการดำเนินการเมื่อต้องรับมือกับปัญหาการเลือกปฏิบัติในการวิเคราะห์ข้อมูล อย่างไรก็ตาม ผลการศึกษาของเราระบุถึงอุปสรรคจำนวนมากต่อกลยุทธ์ที่เสนอ เช่น ปัญหาทางเทคนิค ความท้าทายด้านแนวคิด อคติของมนุษย์ และข้อบกพร่องของกฎหมาย ซึ่งทั้งหมดนี้เป็นอุปสรรคต่อการดำเนินการตามแนวทางปฏิบัติในการทำเหมืองข้อมูลที่เป็นธรรมดังกล่าว เนื่องจากความเสี่ยงของการเลือกปฏิบัติในการทำเหมืองข้อมูลและการวิเคราะห์เชิงคาดการณ์ และการขาดแคลนการศึกษาเชิงประจักษ์อย่างเด่นชัดในหัวข้อที่การทบทวนของเราได้นำมาซึ่งความกระจ่าง เรายืนยันว่าจำเป็นต้องมีการวิจัยเชิงประจักษ์มากขึ้นเพื่อประเมินว่าการเลือกปฏิบัตินั้นเกิดขึ้นโดยเจตนาและโดยไม่ได้ตั้งใจอย่างไร เพิ่มการใช้งานในหลายภาคส่วน เช่น การดูแลสุขภาพ การตลาด และการย้ายถิ่น นอกจากนี้ เนื่องจากการศึกษาส่วนใหญ่มุ่งเน้นไปที่ผลการเลือกปฏิบัติเชิงลบของ Big Data จึงจำเป็นต้องมีการวิจัยเพิ่มเติมเกี่ยวกับวิธีที่เทคโนโลยีการทำเหมืองข้อมูลหากนำไปใช้อย่างเหมาะสม อาจเป็นเครื่องมือที่มีประสิทธิภาพในการป้องกันการเลือกปฏิบัติที่ไม่เป็นธรรมและส่งเสริมความเท่าเทียมกัน เมื่อมีรายงานเพิ่มเติมจากสื่อมวลชนเกี่ยวกับการใช้เทคโนโลยีข้อมูลเชิงบวกเพื่อช่วยเหลือกลุ่มเสี่ยง การวิจัยในอนาคตควรมุ่งเน้นไปที่การแพร่กระจายของแอปพลิเคชันที่เป็นประโยชน์ที่คล้ายคลึงกัน อย่างไรก็ตาม เนื่องจากแม้การปฏิบัติดังกล่าวจะสร้างความแตกต่างรูปแบบใหม่ระหว่างผู้ที่สามารถเข้าถึงเทคโนโลยีดิจิทัลและผู้ที่ไม่สามารถเข้าถึง การวิจัยควรเน้นที่การใช้กลยุทธ์เชิงปฏิบัติเพื่อลดการแบ่งแยกทางดิจิทัลมากขึ้น

บทความนี้รวบรวมแนวทางที่แตกต่างกันสองวิธีในสังคมวิทยาเศรษฐกิจใหม่—การฝังตัวของโครงสร้างและการฝังตัวของวัฒนธรรม—เพื่อทำความเข้าใจการเปลี่ยนแปลงและการพัฒนาของตลาด ตลาดได้รับการพิจารณาว่ามีการฝังตัวมากเกินไปในโครงสร้างทางสังคม และประเมินว่ากำลังตกต่ำเมื่อธุรกรรมทางเศรษฐกิจของพวกเขาขึ้นอยู่กับลูกค้ารอง ซึ่งผู้ค้าปลีกทำหน้าที่เป็นผู้มีอุปการคุณและซัพพลายเออร์ในฐานะลูกค้า จากข้อมูลชาติพันธุ์วิทยาจากตลาดมะนาวในเมือง Hui การศึกษานี้ตรวจสอบว่าตลาดประเภทนี้พัฒนาอย่างไรเมื่อมีธุรกรรมที่ฝังอยู่ในกลุ่มลูกค้ารอง จากมุมมองของโหมดการเชื่อมต่อระหว่างโครงสร้างและวัฒนธรรม ผลการวิจัยเหล่านี้แสดงให้เห็นว่าการเหนี่ยวนำการมีเพศสัมพันธ์จากเครือข่ายลูกค้ารองและอุดมการณ์ทางธุรกิจใหม่เป็นกลไกพื้นฐานที่ช่วยให้สามารถพัฒนาตลาดได้

จากคำกล่าวของ Weber ข้อกำหนดเบื้องต้นที่สำคัญสำหรับระบบทุนนิยมสมัยใหม่หรือแบบมีเหตุมีผลก็คือตลาดควรเป็น “อิสระ” กล่าวคือ การทำธุรกรรมในตลาดไม่ควรเผชิญกับข้อจำกัดที่ไม่สมเหตุผลและแยกออกจากความสัมพันธ์ส่วนตัว (Weber, 2006a [1927], 2006b[1925]). ดังนั้น ความเป็นเหตุเป็นผลอย่างเป็นทางการจึงเป็นลักษณะเฉพาะอย่างหนึ่งของธุรกรรมในตลาดใดๆ อันที่จริง ไม่มีที่สำหรับความสัมพันธ์ส่วนตัวหรือโครงสร้างที่เชื่อถือได้ในแบบจำลองตลาดในอุดมคติหรือในทฤษฎีตลาดแบบคลาสสิก ในทางเศรษฐศาสตร์แบบนีโอคลาสสิก ความสัมพันธ์ทางสังคมถือเป็นสัมประสิทธิ์การเสียดสี และสมมติฐานของตัวแสดงอิสระทำให้ไม่สามารถวิเคราะห์ความสัมพันธ์ทางสังคมได้ สำหรับเศรษฐศาสตร์สถาบันใหม่ สิทธิในทรัพย์สินที่กำหนดไว้อย่างชัดเจนและต้นทุนการทำธุรกรรมที่ต่ำเพียงพอ ดูเหมือนจะเป็นข้อกำหนดเบื้องต้นสำหรับการทำธุรกรรมในตลาดและการรับรู้ถึงประสิทธิภาพทางเศรษฐกิจ ในแง่นี้ การแทรกแซงจากแหล่งการเมืองหรือหน่วยงานต่างๆ จะเป็นอุปสรรคต่อการพัฒนาตลาด เนื่องจากอาจทำให้ขอบเขตของสิทธิในทรัพย์สินไม่ชัดเจน ความสัมพันธ์ส่วนตัวยังทำให้ขอบเขตเหล่านี้สีน้ำเงิน เนื่องจากมีความซ้ำซ้อนในการแลกเปลี่ยนตลาดและเพิ่มต้นทุนการทำธุรกรรม ดังนั้นจึงเป็นข้อกำหนดเบื้องต้นทางทฤษฎีสำหรับการพัฒนาตลาดที่จะแยกการแลกเปลี่ยนตลาดออกจากความสัมพันธ์ส่วนตัวและโครงสร้างอำนาจประเภทต่างๆ อย่างไรก็ตาม การพัฒนาตลาดอย่างต่อเนื่องและการเติบโตทางเศรษฐกิจในประเทศจีนตั้งแต่ปี 2521 ได้ท้าทายมุมมองที่โดดเด่นนี้ ตามที่ Whyte โต้แย้ง (2552 ) ผลการดำเนินงานทางเศรษฐกิจอันน่าทึ่งของจีนตั้งแต่ปี 2521 ไม่เพียงแต่ไม่คาดคิดเท่านั้น แต่ยังขัดแย้งกันอย่างมากที่ได้รับความรู้ในการศึกษาการพัฒนา ความขัดแย้งที่สำคัญประการหนึ่งอยู่ในข้อเท็จจริงที่ว่าแทนที่จะจางหายไปเมื่อตลาดเติบโตขึ้น ความสัมพันธ์ส่วนตัวและโครงสร้างอำนาจยังคงมีบทบาทสำคัญต่อการแลกเปลี่ยนทางเศรษฐกิจและการพัฒนาตลาด กล่าวโดยสรุป จีนประสบความสำเร็จทางเศรษฐกิจอย่างมาก ในขณะที่ตลาดส่วนใหญ่ของตนถูกฝังอยู่ในโครงสร้างทางสังคมที่ฝังตัวมากเกินไป

เครือข่ายผู้อุปถัมภ์สามารถกำหนดเป็นความสัมพันธ์การแลกเปลี่ยนเฉพาะระหว่างสองฝ่ายที่มีสถานะต่างกันเชิงอรรถ1เกี่ยวข้องกับทั้งความสัมพันธ์ส่วนตัวและโครงสร้างอำนาจ เมื่อการแลกเปลี่ยนทางเศรษฐกิจผูกมัดตัวเองกับความสัมพันธ์ในเครือข่ายผู้อุปถัมภ์ ตลาดจะ “ไม่เป็นอิสระ” เนื่องจากโครงสร้างทางสังคม “ฝังตัวมากเกินไป” ในขณะที่การวิจัยทางสังคมวิทยาล่าสุดได้สนับสนุนแนวคิดที่ว่าการฝังตัวทางสังคมเป็นลักษณะสำคัญของสถาบันตลาดสมัยใหม่และมีส่วนทำให้เกิดผลลัพธ์ทางเศรษฐกิจ (Beckert 2002 ; Abolafia 2005 ; Fu 2009) กลไกทางสังคมซึ่งความสัมพันธ์ระหว่างการแลกเปลี่ยนตามเครือข่ายผู้อุปถัมภ์เอื้ออำนวยต่อการพัฒนาตลาดและเสถียรภาพได้ถูกละเลยไปมาก กรณีวิกฤตที่อาจให้ความกระจ่างเกี่ยวกับคำถามนี้ ตลาดมะนาวในเมืองฮุ่ยถือเป็นโอกาสสำคัญที่เราจะทำความเข้าใจและอธิบายตำนานและความขัดแย้งที่เกิดขึ้นในประเทศจีนในช่วงระยะเวลาของการเปลี่ยนแปลงนี้

ภูมิหลังและกรอบทางทฤษฎี
เครือข่ายลูกค้าอุปถัมภ์และการพัฒนาตลาด
ความสัมพันธ์ทางสังคมมีบทบาทสำคัญในกิจกรรมการตลาดในประเทศจีน ซึ่งนักวิชาการบางคนได้ข้อสรุปว่าการเข้าสู่ตลาดในประเทศจีนหมายถึงการฝังตัวเองในเว็บขนาดยักษ์ของความสัมพันธ์ทางสังคม (Su & Littlefield 2001 ) และสำหรับชาวจีน การหล่อเลี้ยงความสัมพันธ์ทางสังคมคือ พื้นฐานในการดำเนินกิจกรรมเชิงพาณิชย์ (Hamilton 2006 ) แม้จะมีมุมมองที่แตกต่างกันเกี่ยวกับแก่นแท้ ความเหลื่อมล้ำ และการเสื่อมถอยของความสัมพันธ์ทางสังคม นักวิชาการเห็นด้วยกับบทบาทของความสัมพันธ์ทางสังคม—พวกเขาไม่เพียงกำหนดประสิทธิภาพทางเศรษฐกิจและการเติบโตอย่างยั่งยืนขององค์กรเท่านั้น แต่ยังเป็นหนึ่งในปัจจัยสำคัญที่ช่วยเสริมสร้างความเข้มแข็ง เศรษฐกิจจีน (Chan 2000 ; Keister 2001 ; Gold et al. 2002; หลัว2007 ). เครือข่ายผู้อุปถัมภ์เป็นองค์ประกอบสำคัญของเว็บความสัมพันธ์ในตลาดขนาดมหึมา อันที่จริง การวิจัยทางสังคมวิทยาส่วนใหญ่ที่เน้นที่ความสัมพันธ์ในตลาดได้สัมผัสถึงแนวคิดของเครือข่ายผู้มีอุปการคุณโดยปริยาย ถึงแม้ว่าพวกเขาจะไม่ได้ตั้งใจตรวจสอบเครือข่ายดังกล่าวโดยตรงก็ตาม หลายคนเห็นพ้องกันว่าการเกิดขึ้นของเครือข่ายอุปถัมภ์และบทบาทสำคัญในการทำธุรกรรมทางการตลาดเป็นสิ่งประดิษฐ์ของทรัพย์สินทางสถาบันของสังคมในช่วงการเปลี่ยนผ่าน (Odgaard 1992 ; Zhang 1996 )

ตามข้อมูลของ (Oi 1989 ) ก่อนการปฏิรูปตลาด ประชาชนทั่วไปหันไปพึ่งผู้อุปถัมภ์ทางการเมือง แสวงหาการสนับสนุนเพื่อผลประโยชน์ส่วนตัวด้วยวิธีการที่มีอยู่อย่างจำกัด อย่างไรก็ตาม หลังการปฏิรูป ความสัมพันธ์ระหว่างลูกค้า-อุปถัมภ์ยังคงมีความสำคัญในการได้รับโอกาสทางเศรษฐกิจและมีความซับซ้อนมากขึ้นเรื่อยๆ แม้ว่าธุรกรรมทางเศรษฐกิจจะพึ่งพาตลาดมากกว่ารัฐ เธอได้โต้แย้งเพิ่มเติมว่าการพึ่งพาเครือข่ายทางการเมืองและโครงสร้างระบบราชการเป็นลักษณะเฉพาะของเศรษฐกิจเทศบาลและเน้นย้ำถึงความสำคัญของเครือข่ายอุปถัมภ์ต่อการพัฒนาเศรษฐกิจ (Oi 1999)). ข้อโต้แย้งที่คล้ายคลึงกันได้รับการกำหนดขึ้นจากมุมมองของปฏิสัมพันธ์ระหว่างชนชั้นสูงทางการเมืองและเศรษฐกิจ (Shirk 1993 ; Dickson 2008 ) และความผูกพันระหว่างรัฐบาลและองค์กรต่างๆ (Lu และ Pan 2009 ); ฉันทามติทั่วไปคือความสัมพันธ์ที่ใกล้ชิดระหว่างชนชั้นสูงทางการเมืองและเศรษฐกิจ (การแต่งงานของอำนาจและความมั่งคั่ง) ได้ขับเคลื่อนการเติบโตทางเศรษฐกิจมหภาคในประเทศจีน

สำหรับนักวิชาการบางคนที่ศึกษาเกี่ยวกับลูกค้าในระบบเศรษฐกิจการค้าของจีนอย่างชัดเจน (เช่น Nee 1992และ Wank 1995 ) ความสนใจของพวกเขาจะเน้นไปที่รูปแบบของปฏิสัมพันธ์ระหว่างระบบราชการกับองค์กร ตลอดจนรากเหง้าของสถาบัน ทั้ง Nee ( 1992 ) และ Wank ( 1995) เห็นพ้องกันว่า “การพึ่งพาลูกค้า” ก่อนการปฏิรูปตลาดได้พัฒนาเป็น “ลูกค้าสัมพันธ์” ระหว่างนักธุรกิจเอกชนและเจ้าหน้าที่ แม้ว่าความสัมพันธ์แบบอุปถัมภ์รูปแบบใหม่นี้จะปฏิเสธการเข้าถึงการแข่งขันทางการตลาดอย่างเท่าเทียม แต่องค์กรทางเศรษฐกิจและรูปแบบการดำเนินงานที่หล่อหลอมโดยความสัมพันธ์ดังกล่าวไม่ได้หมายความว่าจะไร้ประสิทธิภาพ อย่างไรก็ตาม Nee โต้แย้งว่าเครือข่ายรายชื่อลูกค้าเป็นผลจากระบบสถาบันที่ยังไม่พัฒนา และด้วยเหตุนี้จึงคาดว่าจะหลุดออกไปเมื่อสถาบันทางการตลาดเติบโตเต็มที่ (Nee 1992 ) กล่าวอีกนัยหนึ่ง ความสัมพันธ์ระหว่างผู้อุปถัมภ์กับลูกค้าระหว่างรัฐบาลและองค์กรธุรกิจเป็นผลจากการปฏิรูปตลาดที่ยังไม่บรรลุนิติภาวะและการตลาดในระดับต่ำ Wank มีมุมมองที่เป็นปฏิปักษ์ ในการศึกษาช่วงแรกของเขา Wank ( พ.ศ. 2538)) ให้เหตุผลว่า จากมุมมองของรัฐบาลท้องถิ่น สถาบันของรัฐที่มีอำนาจและคุณลักษณะของกลไกการดำเนินงานของตนได้จัดให้มีเงื่อนไขสำหรับการสร้างพันธมิตรระหว่างเจ้าหน้าที่ท้องถิ่นและผู้ประกอบการ ในขณะที่รายได้ที่ลดลงและความไม่แน่นอนที่เพิ่มขึ้นในกระบวนการปฏิรูปตลาดจะสร้างแรงจูงใจให้กับท้องถิ่น ให้เจ้าหน้าที่เข้าร่วมเป็นพันธมิตรดังกล่าว ในการศึกษาต่อไป Wank ( พ.ศ. 2539 ) ยังคงวิเคราะห์จากมุมมองของผู้ประกอบการ และสรุปว่า ผู้ประกอบการในประเทศจีนเป็นกลยุทธ์ทางการตลาด หล่อเลี้ยงความสัมพันธ์กับผู้ปฏิบัติงานในท้องถิ่นในการแสวงหาผลกำไรที่สูงขึ้น และความสัมพันธ์ทางราชการดังกล่าวเรียกว่า “ผู้มีพระคุณ” ” ( houtai laobanแปลว่า “หัวหน้าหลังเวที”) และ “ผู้สนับสนุน” ( kaoshan). การศึกษาของ Wank บ่งชี้ว่าการยึดลูกค้าเป็นแบบสถาบันในธรรมชาติของเศรษฐกิจตลาดโดยมีฐานสถาบันของตัวเองสำหรับความไว้วางใจทางสังคมและความสมเหตุสมผลของพฤติกรรม ลูกค้าดังกล่าวจะไม่จางหายไปในระหว่างกระบวนการทางการตลาด—เนื่องจากตัวลูกค้าเองได้กลายเป็นองค์ประกอบโดยธรรมชาติของการตลาดและให้เหตุผลสำหรับกิจกรรมทางการตลาด (Wank 1996 )

การแก้ไขภายในการทดลองในการทดลองแต่ละครั้ง เราคาดว่าผู้เข้าร่วมจะระบุรายการที่จะค้นหา ทายผลบอล จากนั้นค้นหาในรายการอื่นในขณะที่เก็บรายการเป้าหมายทั้งหมดหรือบางส่วนไว้ในหน่วยความจำ เมื่อพบการจับคู่ที่เป็นไปได้ พวกเขาจะขยับตาหรือเมาส์ไปมาระหว่างรายการเพื่อยืนยันว่ารายการตรงกันก่อนที่จะตอบสนอง ดังนั้น เราคาดว่าจะมีการแก้ไขและการแก้ไขหลายรายการในสินค้าที่ผู้เข้าร่วมทำเครื่องหมายในแต่ละการทดลองและรายการที่เกี่ยวข้องในรายการของสิ่งอำนวยความสะดวก และการแก้ไขน้อยลงในรายการใดๆ ที่ไม่ใช่เป้าหมายในการทดลองนั้น นอกจากนี้ ภายในรายการตรวจสอบแต่ละรายการ ยังมีคู่คอนเทนเนอร์ซีลประเภทต่างๆ ที่มีความยากต่างกัน ไอเทมในเงื่อนไขการจับคู่นั้นค่อนข้างง่าย เนื่องจากผู้เข้าร่วมต้องยืนยันว่ารายการในรายการตรวจสอบและรายการที่ตรงกันในรายการของสิ่งอำนวยความสะดวกนั้นเหมือนกัน อย่างไรก็ตาม การตรวจสอบรายการประเภทอื่นๆ (Missing, Wrong Container, Transposed และ Transposed Match) นั้นซับซ้อนกว่า รายการที่ขาดหายไปไม่ปรากฏในรายการอื่น ดังนั้นผู้เข้าร่วมอาจตรวจสอบและตรวจสอบรายการทั้งหมดอีกครั้งเพื่อยืนยันว่ารายการที่ขาดหายไป รายการอื่นๆ ทั้งหมดมีปัญหาที่อาจจำเป็นต้องเปรียบเทียบเพิ่มเติมกับรายการเป้าหมายในรายการตรวจสอบของผู้เข้าร่วม เราคาดว่าจะเห็นการแก้ไขเพิ่มเติมของรายการเป้าหมายและรายการที่เกี่ยวข้องในรายการสิ่งอำนวยความสะดวกสำหรับเงื่อนไขเหล่านี้มากกว่าสำหรับเงื่อนไขการจับคู่ และ Transposed Match) มีความซับซ้อนมากขึ้น รายการที่ขาดหายไปไม่ปรากฏในรายการอื่น ดังนั้นผู้เข้าร่วมอาจตรวจสอบและตรวจสอบรายการทั้งหมดอีกครั้งเพื่อยืนยันว่ารายการที่ขาดหายไป รายการอื่นๆ ทั้งหมดมีปัญหาที่อาจจำเป็นต้องเปรียบเทียบเพิ่มเติมกับรายการเป้าหมายในรายการตรวจสอบของผู้เข้าร่วม เราคาดว่าจะเห็นการแก้ไขเพิ่มเติมของรายการเป้าหมายและรายการที่เกี่ยวข้องในรายการสิ่งอำนวยความสะดวกสำหรับเงื่อนไขเหล่านี้มากกว่าสำหรับเงื่อนไขการจับคู่ และ Transposed Match) มีความซับซ้อนมากขึ้น รายการที่ขาดหายไปไม่ปรากฏในรายการอื่น ดังนั้นผู้เข้าร่วมอาจตรวจสอบและตรวจสอบรายการทั้งหมดอีกครั้งเพื่อยืนยันว่ารายการที่ขาดหายไป รายการอื่นๆ ทั้งหมดมีปัญหาที่อาจจำเป็นต้องเปรียบเทียบเพิ่มเติมกับรายการเป้าหมายในรายการตรวจสอบของผู้เข้าร่วม เราคาดว่าจะเห็นการแก้ไขเพิ่มเติมของรายการเป้าหมายและรายการที่เกี่ยวข้องในรายการสิ่งอำนวยความสะดวกสำหรับเงื่อนไขเหล่านี้มากกว่าสำหรับเงื่อนไขการจับคู่

พลวัตการค้นหาภาพ เพื่อตรวจสอบความสัมพันธ์ระหว่างตัววัดที่สร้างโดยกระบวนทัศน์ foveation เทียมกับตัวชี้วัดที่มักใช้กับข้อมูลการติดตามการมอง เราเปรียบเทียบระยะเวลา ความถี่ และลำดับที่ผู้เข้าร่วมกำหนดรายการประเภทต่าง ๆ ภายในรายการ ขั้นแรก เราคำนวณจำนวนการแก้ไข (จริงหรือเทียม) ต่อการทดลองหนึ่งครั้งเพื่อยืนยันสมมติฐานว่าเงื่อนไขการนำเสนอรายการยากขึ้นซึ่งสร้างเวลาตอบสนองนานขึ้นต่อการทดลองแต่ละครั้งมีจำนวนการแก้ไขต่อการทดลองสูงขึ้นเช่นกัน นอกจากนี้ เรายังประเมินด้วยว่าผู้เข้าร่วมทำการตรึงและแก้ไขรายการในรายการบางประเภทบ่อยเพียงใด (ตรงกัน ผิดคอนเทนเนอร์ ฯลฯ) ภายในการทดลองแต่ละครั้ง ต่อไป เราใช้การติดตามการมองและข้อมูลการเอียงเทียมเพื่อเปรียบเทียบระยะเวลาที่ผู้เข้าร่วมจดจ่ออยู่กับรายการที่ง่ายกว่าและยากกว่าในระหว่างกระบวนการค้นหาด้วยภาพ สุดท้าย เราใช้ข้อมูลรอยพับเทียมเพื่อสร้างเส้นทางการสแกนที่สามารถเปรียบเทียบได้กับเส้นทางการสแกนที่สร้างโดยข้อมูลการติดตามการมอง จากนั้นเราใช้เส้นทางการสแกนเพื่อตรวจสอบว่าผู้เข้าร่วมในการทดลองทั้งสองครั้งใช้กลยุทธ์การค้นหาที่คล้ายคลึงกันหรือไม่ แม้ว่าจะมีข้อจำกัดที่แตกต่างกันซึ่งกำหนดโดยกระบวนทัศน์ foveation ประดิษฐ์

ภาพขนาดเต็มเพื่อเปรียบเทียบสิ่งที่เราค้นพบกับเอฟเฟกต์ขนาดชุดมาตรฐานในเอกสารการค้นหาด้วยภาพโดยตรง ความชันของขนาดชุดแต่ละรายการถูกคำนวณโดยการคำนวณการถดถอยเชิงเส้นบน RT สำหรับแต่ละวิชา สำหรับการทดลองที่ตรงกันและการทดลองที่ขาดหายไป (เช่น เป้าหมายปัจจุบันและเป้าหมายที่ขาดไป) แยกจากกัน ผู้เข้าร่วมสองคนจากการทดลองเทียมถูกลบออกจากการวิเคราะห์นี้เนื่องจากข้อมูลที่ขาดหายไปในเงื่อนไข “เป้าหมายที่หายไป” การวิเคราะห์ความแปรปรวนแบบผสมได้ดำเนินการกับข้อมูลความชันด้วยปัจจัยระหว่างอาสาสมัครของการทดลอง (การติดตามดวงตากับความลาดเอียงเทียม) และปัจจัยภายในกลุ่มของประเภทการทดลอง (การจับคู่กับส่วนที่ขาดหายไป) ผลลัพธ์แสดงให้เห็นผลกระทบหลักของการทดลอง ( F (1, 26) = 20.62, p  < 0.001, η p 2 = 0.44) แสดงว่าความลาดชันของกระบวนทัศน์ foveation ประดิษฐ์โดยรวมมีขนาดใหญ่ขึ้น นอกจากนี้ ทางลาดสำหรับรายการที่ขาดหายไปนั้นใหญ่กว่าสำหรับรายการที่ตรงกัน ( F (1, 26) = 48.56, p  < 0.001, η p 2  = 0.96) รูปแบบนี้บ่งชี้ว่างานของเราเปรียบได้กับงานค้นหาด้วยภาพแบบคลาสสิกที่ต้องใช้การค้นหาด้วยภาพที่ไม่มีประสิทธิภาพ ที่สำคัญ ไม่มีปฏิสัมพันธ์ระหว่างการทดลองกับประเภทการทดลอง ( F (1, 26) = 1.69, p = 0.20). สิ่งนี้บ่งชี้ว่าแม้ว่าความลาดชันโดยรวมจะใหญ่กว่าสำหรับการทดสอบการลอยตัวแบบเทียม แต่ขนาดของความแตกต่างระหว่างความลาดชันสำหรับการทดลองแบบจับคู่และการทดลองที่ขาดหายไปนั้นเทียบได้กับการทดลองทั้งสองครั้ง เพื่อยืนยันสิ่งนี้ เราเปรียบเทียบอัตราส่วนความชันระหว่างการทดลองที่ตรงกันกับการทดลองที่ขาดหายไป (อัตราส่วนฟูกเทียมเฉลี่ย = 1.74 อัตราส่วนการติดตามดวงตาเฉลี่ย = 2.08) ANOVA ระหว่างอาสาสมัครกับปัจจัยของการทดลองยืนยันว่าอัตราส่วนความชันเหล่านี้ไม่แตกต่างกันอย่างมีนัยสำคัญ ( F (1, 26) = 1.44, p = 0.24). ผลลัพธ์เหล่านี้แสดงให้เห็นว่าความสัมพันธ์ระหว่างความลาดเอียงของการค้นหาปัจจุบันของเป้าหมายและเป้าหมายที่ขาดหายไปนั้นสอดคล้องกันในทั้งสองวิธี ทายผลบอล กระบวนทัศน์ของ foveation ประดิษฐ์ทำให้ผู้เข้าร่วมช้าลงโดยทั่วไป แต่ไม่ได้เปลี่ยนแปลงพลวัตของกระบวนการค้นหาด้วยภาพ