Data concerning 20,000 arthropod specimens were mined, or extracted, from the zoological collections records, from a natural history museum’s database, overarchingly containing 2,030,159 specimens. Thereafter, these delimited data were sorted and differentially classified, in search of geographical distribution patterns pointing to trends in ecological, phylogenetic, and morphological change. Differentiable characteristics of the specimens provided the foundation for classification. The criteria used to sort the arthropod specimens encompassed, inter alia, their catalog numbers, taxonomic ranks, and binomial nomenclatures. And subsequently, various quantitative techniques underwent application to identify species satisfying the criteria therein depicted. Resultantly, usage of these sorting criteria, e.g., through reliance on a non-probabilistic binary linear classifier created using an algorithm implemented in the Visual Basic for Applications programming, and thus Turing-complete, language, led to a bifurcated classification of multiple species. As indicated by tabulated data, the first assemblage of organisms consists of arthropod species for which the Field Museum’s collections contain, at a minimum, 100 specimens. The second organism amassment encompasses arthropod species having at least 40 tabulated and identified specimens on file. By way of elucidation, the quantitative, analytic procedures used to build this dataset yielded a slew of critical discoveries. In addition to highlighting topics for future research in zoological morphology, these findings are crucial for identifying the limitations of zoological collections data.
Des données concernant 20 000 spécimens d'arthropodes ont été extraites des registres des collections zoologiques, parmi les entrées de la base de données d'un musée d'histoire naturelle, de Chicago, Illinois, États-Unis, contenant globalement 2 030 159 spécimens. Par la suite, ces données délimitées ont été triées et classées de manière différentielle, à la recherche de schémas de répartition géographique indiquant des tendances de changement écologique, phylogénétique et morphologique. Les caractéristiques différenciables des spécimens ont fourni une base de classification. Les critères utilisés pour trier les spécimens d'arthropodes comprenaient, entre autres, leurs numéros de catalogue, leurs rangs taxonomiques et leurs nomenclatures binomiales. Et par la suite, diverses techniques quantitatives ont été appliquées pour identifier les espèces satisfaisant aux critères qui y sont décrits. En conséquence, l'utilisation de ces critères de tri, par exemple en s'appuyant sur un classificateur linéaire binaire non probabiliste créé à l'aide d'un algorithme implémenté dans le langage de programmation Visual Basic For Applications, en étant Turing-complet, a conduit à une classification bifurquée de plusieurs espèces. Comme l'indiquent les données tabulées, le premier assemblage d'organismes est constitué d'espèces d'arthropodes pour lesquelles les collections du Field Museum contiennent au minimum 100 spécimens. Le deuxième regroupement d'organismes englobe les espèces d'arthropodes ayant au moins 40 spécimens tabulés et identifiés au dossier. De manière élucidante, les procédures quantitatives et analytiques utilisées pour construire cet ensemble de données ont donné lieu à une multitude de découvertes importantes. En plus de mettre en évidence des sujets de recherche future en morphologie zoologique, ces résultats sont cruciaux pour identifier les limites des données des collections zoologiques contenues dans les musées.
Done, oubyen enfòmasyon an chif, konsènan 20 mil espesimèn atwopòd te sibi ekstrè, oubyen triyaj, pami dosye koleksyon zowolojik, ki soti nan baz de done yon mize istwa natirèl, ki gen 2 milyon, 30 mil, ak 159 espesimèn an jeneral. Apre sa, done ki gen limit sa yo te klasifye an diferan klas, pou twouve tandans distribisyon jewografik ki ka montre tandans nan chanjman ekolojik, filojenetik, ak mòfolojik. Karakteristik ki diferan pami espesimèn yo te bay fondasyon pou fè klasifikasyon. Kritè yo te itilize pou triye espesimèn atwopòd yo te enkli pami yo nimewo katalòg, ran taksonomik, ak nomanklati ki baze sou de non. Apre sa, plizyè teknik kantitatif, ki itilize chif, te sibi aplikasyon pou idantifye espès ki satisfè kritè ki dekri nan travay sa. Pou rezilta, itilizasyon kritè klasman sa yo, pa egzanp, atravè depandans sou yon metòd klasifikasyon lineyè debò ki pa pwobalistik, ki te fèt an itilizan yon algorithm aplike nan "Visual Basic for Applications," e konsa yon langaj pwogramasyon òdinatè ki Turing-konplè, te bay yon rezilta klasifikasyon debò de plizyè espès. Jan yo endike nan tablo done, premye asanblaj òganis ki genyen gen espès atwopòd pou lekèl koleksyon ki nan mize Field sa genyen omwen 100 espesimèn. Dezyèm rasanbleman òganis lan gen ladan l espès atwopòd ki gen omwen 40 espesimèn nan tablo epi ki sibi idantifikasyon ki nan dosye. Yon fason klè, pwosedi ki baze sou matematik, epi ki analitik, itilize pou konstwi baz de done sa a te deklannche yon pakèt bagay ki dekouvri epi ki enpòtan. Anplis ke souliye sijè ki merite rechèch nan lavni nan mòfoloji zowolojik, rezilta sa yo zenpòtan anpil pou idantifye limit done koleksyon zowolojik twouve nan mize.
Shen Helen. Chicago's Field Museum cuts back on science. Nature. 2012. Springer Science and Business Media LLC. [Cross Ref]
Ariño Arturo H.. Approaches to estimating the universe of natural history collections data. Biodiversity Informatics. Vol. 7(2)2010. The University of Kansas. [Cross Ref]
Lane Meredith A.. Roles of Natural History Collections. Annals of the Missouri Botanical Garden. Vol. 83(4)1996. JSTOR. [Cross Ref]
MacLean Heidi J., Nielsen Matthew E., Kingsolver Joel G., Buckley Lauren B.. Using museum specimens to track morphological shifts through climate change. Philosophical Transactions of the Royal Society B: Biological Sciences. Vol. 374(1763)2019. The Royal Society. [Cross Ref]
Faugas Woodger, Faugas Woodger. Zoological Collections: Data on 20,000 Arthropod Specimens Collected in Illinois from the Years 1903 to 2003. 2021. Harvard Dataverse. [Cross Ref]
Puspasari Shinta, Ermatita Ermatita. A Survey of Data Mining Techniques for Smart Museum Applications. JUITA: Jurnal Informatika. Vol. 9(1)2021. Lembaga Publikasi Ilmiah dan Penerbitan Universitas Muhammadiyah Purwokerto. [Cross Ref]
Funk Vicki A.. Collections-based science in the 21st Century. Journal of Systematics and Evolution. Vol. 56(3):175–193. 2018. Wiley. [Cross Ref]
Schmidt Jonathan, Marques Mário R. G., Botti Silvana, Marques Miguel A. L.. Recent advances and applications of machine learning in solid-state materials science. npj Computational Materials. Vol. 5(1)2019. Springer Science and Business Media LLC. [Cross Ref]