fix: fix slang regex (#433)

This commit is contained in:
ThereDrD0
2024-07-10 14:02:03 +03:00
committed by GitHub
parent 5bf080f4f2
commit dc5a30e6ee
2 changed files with 56 additions and 55 deletions

View File

@@ -161,7 +161,7 @@ public sealed class ChatSanitizationManager : IChatSanitizationManager
//WD-EDIT //WD-EDIT
public string SanitizeOutSlang(string input) public string SanitizeOutSlang(string input)
{ {
var pattern = @"(^\!|^\?|[\p{L}\d'`-]+)"; var pattern = @"(^\!|^\?|[\p{L}\d'`%-]+)";
var newMessage = Regex.Replace(input, pattern , var newMessage = Regex.Replace(input, pattern ,
match => _slangToNormal.ContainsKey(match.Groups[1].Value.ToLower()) ? _slangToNormal[match.Groups[1].Value.ToLower()] : match.Value, RegexOptions.IgnoreCase); match => _slangToNormal.ContainsKey(match.Groups[1].Value.ToLower()) ? _slangToNormal[match.Groups[1].Value.ToLower()] : match.Value, RegexOptions.IgnoreCase);

View File

@@ -1,56 +1,57 @@
{ {
"%срп": "стандартные рабочие процедуры", "%срп": "стандартные рабочие процедуры",
"%дек": "детектив", "%дек": "детектив",
"%дек": "детектив", "%деку": "детективу",
"%деку": "детективу", "%дека": "детектива",
"%дека": "детектива", "%дэк": "детектив",
"%дэк": "детектив", "%дэку": "детективу",
"%дэку": "детективу", "%мед": "медицинский",
"%мед": "медицинский", "%дэка": "детектива",
"%дэка": "детектива", "%инжи": "инженеры",
"%инжи": "инженеры", "%инж": "инженер",
"%инж": "инженер", "%инжам": "инженерам",
"%инжам": "инженерам", "%инжы": "инженеры",
"%инжы": "инженеры", "%инжу": "инженеру",
"%инжу": "инженеру", "%таблы": "таблетки",
"%таблы": "таблетки", "%мш": "имплант защиты разума",
"%мш": "имплант защиты разума", "%мщ": "имплант защиты разума",
"%разгерм": "разгерметизация", "%разгерм": "разгерметизация",
"%разгерма": "разгерметизация", "%разгерма": "разгерметизация",
"%разгерму": "разгерметизацию", "%разгерму": "разгерметизацию",
"%разгерме": "разгерметизации", "%разгерме": "разгерметизации",
"%разгермы": "разгерметизации", "%разгермы": "разгерметизации",
"%крит": "критическое состояние", "%крит": "критическое состояние",
"%крите": "критическом состоянии", "%крите": "критическом состоянии",
"%рева": "революция", "%рева": "революция",
"%рёва": "революция", "%рёва": "революция",
"%рево": "революция", "%рево": "революция",
"%рев": "революционер", "%рев": "революционер",
"%хз": "я не знаю", "%хз": "я не знаю",
"%магмы": "магнитные ботинки", "%магмы": "магнитные ботинки",
"%изоли": "изолирующие перчатки", "%изоли": "изолирующие перчатки",
"%изольки": "изолирующие перчатки", "%изольки": "изолирующие перчатки",
"%изолек": "изолирующих перчаток", "%изолек": "изолирующих перчаток",
"%кз": "космический закон", "%кз": "космический закон",
"%синга": "сингулярность", "%синга": "сингулярность",
"%синг": "сингулярность", "%синг": "сингулярность",
"%сингу": "сингулярность", "%сингу": "сингулярность",
"%синги": "сингулярности", "%синги": "сингулярности",
"%яо": "ядерные оперативники", "%яо": "ядерные оперативники",
"%яой": "ядерные оперативники", "%яой": "ядерные оперативники",
"%яошники": "ядерные оперативники", "%яошники": "ядерные оперативники",
"%яойшики": "ядерные оперативники", "%яойшики": "ядерные оперативники",
"%яойники": "ядерные оперативники", "%яойники": "ядерные оперативники",
"%уч": "ускоритель частиц", "%уч": "ускоритель частиц",
"%спс": "спасибо", "%спс": "спасибо",
"%плиз": "пожалуйста", "%плиз": "пожалуйста",
"%эвак": "эвакуацию", "%эвак": "эвакуацию",
"%вв": "высоковольтные", "%вв": "высоковольтные",
"%св": "средневольтные", "%св": "средневольтные",
"%нв": "низковольтные", "%нв": "низковольтные",
"%кк": "красный код", "%кк": "красный код",
"%зк": "зеленый код", "%зк": "зеленый код",
"%ск": "синий код", "%ск": "синий код",
"%жк": "желтый код", "%жк": "желтый код",
"%жк": "желтый код" "%стим": "стимулятор",
"%стимы": "стимуляторы"
} }