Düzenli ifadeler
Düzenli ifadeler Yandex.Webmaster’da URL verilerini filtrelemek için kullanılabilir:
- Aramaya dahil edilen sayfalar
- Site sayfalarının tarama istatistikleri
- Harici bağlantılar
- Sorgu izleme
İfadeler RE2 söz dizimine ve aşağıdaki kurallara göre ayrıştırılır:
- Düzenli ifade, protokol ve etki alanı adı dahil olmak üzere sayfanın tüm URL’sine uygulanır. Örneğin, aşağıdaki düzenli ifadeyi kullanabilirsiniz:
^http://
. - Bir düzenli ifade iki kez uygulanır: orijinal URL’ye ve
www
ön eki ile ve onsuz URL’ye. etki alanı adındawww
ön ekine sahip olma durumu, ifade doğrulama sonucunu etkilemez. - Düzenli ifade, URL kodlarının (% dizileri) kodu çözülmüş karakterlerle değiştirildiği çözülmüş URL’ye uygulanır. İstisna:
/
,&
,=
,?
ve#
karakterlerinin kodları değiştirilmez. Örneğin,%2F
/
ile değiştirilmez. Not:+
karakteri bir boşluk ile değiştirilir. Örneğin,text=elephant
düzenli ifadesi işlenecektir, ancaktext=%D1%81%D0%BB%D0%BE%D0%BD
vetext =%\w\w
işlenmeyecektir. - Kiril alfabesi içeren URL’ler punycode kullanmaz. Örneğin, normal ifade
^http://ввв\.сайт\.рф/
işlenir, ancak^http://xn--b1aaa\.xn--80aswg\.xn--p1ai/
işlenmez. - Bazı karakterler, normal ifadeler kontrol edilmeden önce URL sonundan çıkarılır:
?
,#
,&
ve nokta (.
). Örneğin, URL’lerhttp://example.com/?
,http://example.com/#
,http://example.com/?var=1&
sırasıylahttp://example.com/
,http://example.com/
,http://example.com/?var=1
ile karşılaştırılır. Kullanıcı URL’yihttp://example.com./
olarak girerse, normal ifade\./$
işlenmez. - Kontrol edilen normal ifadelerde, nicelik belirleyiciler mümkün olduğunca çok karakterle eşleşir.
- URL karakterleri büyük/küçük harf duyarlıdır.
Normal ifadeler notu
Aşağıdaki tabloda, a
, b
, c
, d
, e
herhangi bir karakterdir, n
, m
pozitif sayılardır.
Olası seçenekler |
|
abc|de |
Seçeneklerden birini eşleştirir: |
Karakter sınıfları |
|
[abc] veya [a-c] |
Listedeki (veya aralıktaki) herhangi bir (tek) karakterle eşleşir. |
[^abc] veya [^a-c] |
Listelenen (veya aralıktaki) karakterler dışında herhangi bir (tek) karakterle eşleşir. |
\d |
Bir rakam karakteriyle eşleşir. Eşdeğeri: |
\D |
Bir rakam olmayan karakterle eşleşir. Eşdeğeri: |
\s |
Bir boşluk karakteriyle eşleşir. Eşdeğeri |
\S |
Bir boşluk olmayan karakterle eşleşir. Eşdeğeri |
\pL |
Herhangi bir Unicode karakteriyle eşleşir. |
\w |
Herhangi bir Latin harfi (büyük/küçük), rakam veya alt çizgi karakteriyle eşleşir. Unicode karakterlerle çalışırken, \w yerine |
\W |
Herhangi bir karakterle Latin harfi (büyük/küçük), rakam veya alt çizgi dışında eşleşir. Unicode karakterlerle çalışırken, \w yerine |
Tekrarlama sayısı (nicelik belirleyiciler) |
|
a* |
|
a+ |
|
a? |
Karakter |
a{n,m} |
|
a{n,} |
Karakter |
a{n} |
Karakter |
a*? |
|
a+? |
|
a?? |
Karakter a 0 veya 1 kez tekrarlandığında eşleşir (karakterin varlığı önceliklidir). |
a{n,m}? |
|
a{n,}? |
|
Satırdaki konum: |
|
^ |
Bir dizenin başlangıcını eşleştirir. |
$ |
Bir dizenin sonunu eşleştirir. |
\b |
Kelime sınırını eşleştirir — alfasayısal karakter ( |
\B |
Bir kelime sınırı olmayanı eşleştirir. |
Kaçış |
|
\ |
[ ] \ ^ $ . | ? * + ( ) { } özel karakterinden önce gelen ters eğik çizgi, bu karakterin özel olmadığı ve motamot yorumlanması gerektiği anlamına gelir. Örnek: |
\Q...\E |
|