В корпусе состоящем из 2.5 млн предложений длины 3-45
слова-лексемы отсортированы по частотности и каждому слову назначен частотный рейтинг.
Далее в корпусе искались предложения целиком состоящие из слов, рейтинг которых был не хуже заданного. Таким образом образовались несколько корпусов с нарастающей частотностью слов. Некоторые предложения встречаются в подкорпусах много раз.

Данные корпуса могут использоваться для тестирования систем машинного перевода, семантических/синтаксических анализаторов.

Рейтинг | Длина 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

rating<100(4603) 672 1222 1548 702 255 105 64 21 7 6

rating<200(8255) 507 1953 2481 1659 831 438 203 85 53 22 12 4 2 1 1 1 1 1

rating<300(9143) 219 1559 2522 1960 1275 772 377 204 103 60 40 30 10 2 4 2 3

rating<400(8703) 171 1752 2280 1706 1089 681 436 252 153 82 43 26 9 8 5 5 3 2

rating<500(8277) 92 1545 2135 1738 1050 676 431 236 150 90 54 30 23 11 2 7 5 1

rating<600(8005) 62 1443 1978 1606 1116 694 420 243 185 99 60 40 25 13 8 6 6 1

rating<700(8436) 72 1656 2066 1526 1091 739 459 278 204 156 69 48 34 14 12 5 3 4

rating<800(8614) 61 1423 1916 1730 1185 846 524 331 211 157 77 59 43 17 11 8 11 4

rating<900(7575) 66 1446 1840 1376 982 626 421 279 205 100 86 58 33 23 16 7 6 5

rating<1000(7737) 42 1514 1779 1392 974 696 472 309 202 127 77 62 30 25 19 9 5 3

rating<1100(8660) 47 1525 1847 1536 1159 820 584 403 273 155 114 62 45 36 21 15 10 8

rating<1200(6984) 37 1132 1486 1245 934 665 501 329 221 145 116 55 36 35 22 11 8 6

rating<1300(8092) 40 1242 1596 1456 1116 811 587 378 289 196 134 90 54 32 25 24 12 9

rating<1400(7190) 36 1217 1459 1239 994 706 512 306 245 149 106 78 51 35 24 21 10 2

rating<1500(6294) 35 1111 1349 1098 801 581 416 285 179 137 96 58 48 36 24 20 12 8

rating<1600(6720) 27 1045 1333 1238 875 661 477 341 221 160 97 78 61 33 28 21 9 14

rating<1700(5787) 17 852 1131 961 762 591 424 296 238 135 123 81 63 41 24 22 15 11

rating<1800(5964) 22 1047 1224 1005 807 586 380 271 180 151 82 78 44 32 23 11 8 12

rating<1900(5161) 19 962 1001 879 645 455 373 245 167 133 91 67 48 33 22 11 4 6

rating<2000(5204) 9 836 1031 883 677 489 350 278 192 132 93 77 57 32 24 17 15 11

Рейтинг \| Длина	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
rating<100(4603)	672	1222	1548	702	255	105	64	21	7	6
rating<200(8255)	507	1953	2481	1659	831	438	203	85	53	22	12	4	2	1	1	1	1	1
rating<300(9143)	219	1559	2522	1960	1275	772	377	204	103	60	40	30	10	2	4	2	3
rating<400(8703)	171	1752	2280	1706	1089	681	436	252	153	82	43	26	9	8	5	5	3	2
rating<500(8277)	92	1545	2135	1738	1050	676	431	236	150	90	54	30	23	11	2	7	5	1
rating<600(8005)	62	1443	1978	1606	1116	694	420	243	185	99	60	40	25	13	8	6	6	1
rating<700(8436)	72	1656	2066	1526	1091	739	459	278	204	156	69	48	34	14	12	5	3	4
rating<800(8614)	61	1423	1916	1730	1185	846	524	331	211	157	77	59	43	17	11	8	11	4
rating<900(7575)	66	1446	1840	1376	982	626	421	279	205	100	86	58	33	23	16	7	6	5
rating<1000(7737)	42	1514	1779	1392	974	696	472	309	202	127	77	62	30	25	19	9	5	3
rating<1100(8660)	47	1525	1847	1536	1159	820	584	403	273	155	114	62	45	36	21	15	10	8
rating<1200(6984)	37	1132	1486	1245	934	665	501	329	221	145	116	55	36	35	22	11	8	6
rating<1300(8092)	40	1242	1596	1456	1116	811	587	378	289	196	134	90	54	32	25	24	12	9
rating<1400(7190)	36	1217	1459	1239	994	706	512	306	245	149	106	78	51	35	24	21	10	2
rating<1500(6294)	35	1111	1349	1098	801	581	416	285	179	137	96	58	48	36	24	20	12	8
rating<1600(6720)	27	1045	1333	1238	875	661	477	341	221	160	97	78	61	33	28	21	9	14
rating<1700(5787)	17	852	1131	961	762	591	424	296	238	135	123	81	63	41	24	22	15	11
rating<1800(5964)	22	1047	1224	1005	807	586	380	271	180	151	82	78	44	32	23	11	8	12
rating<1900(5161)	19	962	1001	879	645	455	373	245	167	133	91	67	48	33	22	11	4	6
rating<2000(5204)	9	836	1031	883	677	489	350	278	192	132	93	77	57	32	24	17	15	11