Soubor tvoří data ze 197 lesních ploch rozmístěných po celém světě. Každá plocha má velikost 0,1 ha a je složená z deseti podploch o velikosti 2 × 50 metrů.
Alwyn Howard Gentry (1945-1993) byl americký botanik a taxonom, který se mimo jiné zabýval i popisem druhové bohatosti vegetace v lesích po celém světě. Pro sběr data vyvinul metodu, které se nyní říká “Gentryho transekty”. V relativně homogenním lesním celku umístil 10 na sebe navazujících transektů o velikosti 2 × 50m (100m2), takže celková studovaná plocha měla rozlohu 0,1 hektaru. Tvar podploch (transektů širokých na šířku tyče) byl zvolen proto, že umožňoval poměrně rychlý census. V rámci plochy byly měřeny obvody v prsní výšce pro všechny dřeviny a liány, každý jedinec byl zaznamenán do poznámek. Data tedy obsahují údaje o jedincích v jednotlivých podplochách a jejich obvodu.
Gentryho datový soubor byl zpřístupněn badatelům na výše uvedených stránkách a byl také publikován knižně (Phillips & Miller 2002).
Data z celkem 225 lesních ploch jsou dostupná v elektronické podobě na webové stránce http://www.wlbcenter.org/gentry_data.htm. Do formátu použitelného v programu R jsem data převedl tak, že jsem stáhl zazipovaný archiv se všemi plochami, archiv jsem odzipoval do připraveného adresáře a data z něj jsem vyextrahoval pomocí tohoto skriptu. Z 225 ploch jsem vynechal plochy, které jsou dělány podle jiné metodiky (a nebo obsahují méně než 10 podploch) - konečný počet ploch je tedy 197. Data bezpochyby obsahují chyby, které je potřeba odstranit manuálním pročištěním - o to jsem se ale pro tyto účely nepokoušel 1).
Gentry zakládal plochy na lokalitách po celém světě, velká část lokalit je ale koncentrovaná v Jižní a Severní Americe (odkaz na souřadnice jednotlivých ploch naleznete zde).
Distribuce 197 ploch je na následující mapě, která pochází z článku Qian et al. (2012) (jihoamerické a severoamerické plochy jsou na něm barevně odlišené):
Vedle zeměpisných souřadnic je k dispozici i nadmořská výška a roční srážkový úhrn, tato data jsou uložena v souboru gentry.coord.txt a do eRka je můžete načíst pomocí následujícího skriptu.
f <- file ('http://www.davidzeleny.net/anadat-r/lib/exe/fetch.php?media=data:gentry197.r') load (f) gentry.coord <- read.delim ('http://www.davidzeleny.net/anadat-r/lib/exe/fetch.php?media=data:gentry.coord.txt', row.names = 1)
Skript načte proměnnou 'gentry197', která představuje list se 197 položkami, každou reprezentující matici dat z jedné lokality. Ukázka z dat první lokality vypadá takto:
gentry197[[1]][1:10,1:10]
ANACARDIACEAE M1 M1 ANNONACEAE Monanthotaxis M1 ANNONACEAE Polyalthia henriceii APOCYNACEAE Landolphia M1 APOCYNACEAE Oncinotis M1 APOCYNACEAE Rauvolfia obtusiflora ASCLEPIADACEAE M1 M1 1 0 0 1 2 1 0 0 2 0 0 0 2 0 0 0 3 0 0 0 0 0 0 0 4 0 0 0 1 0 0 0 5 1 0 0 0 0 0 1 6 0 0 0 1 0 1 0 7 0 0 0 1 0 0 0 8 0 0 0 3 0 0 0 9 0 3 0 0 0 0 0 10 0 0 0 1 0 0 0 ASCLEPIADACEAE M2 M1 BIGNONACEAE Stereospermum euphorbioides BIGNONIACEAE Stereospermum tomentosum 1 1 0 0 2 0 0 0 3 2 0 0 4 1 0 0 5 1 1 0 6 0 0 2 7 0 1 0 8 0 0 0 9 0 0 0 10 0 0 0
SANSEBAS.XLS
obsahuje jeden prázdný sloupeček vložený mezi Lines
a Family
, který je třeba z *.xls souboru manuálně odstranit; podobných problémů je v datech víc, a je proto třeba sledovat chybové hlášky při běhu skriptu.